多元回归分析-ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《多元回归分析-ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 分析 ppt 课件
- 资源描述:
-
1、Multiple Linear Regression Analysis1ppt课件一元线性回归模型复习一元线性回归模型复习一个自变量X与一个因变量Y作散点图模型形式 Y=0+1X+回归直线模型的F检验,T检验,(P值相同,作用等价)R2决定系数-相关系数2ppt课件房屋售价 房价房价Y,受面积,受面积X1影响影响, 还有影响因素吗? 受地域x2(市中心与否),结构x3影响(高层与砖混)3ppt课件汽车销售汽车销售若公司管理人员要预测来年该公若公司管理人员要预测来年该公司的汽车销售额司的汽车销售额y时,影响销时,影响销售额的因素售额的因素-广告宣传费广告宣传费x1还有个人可还有个人可支配收入支配
2、收入x2,价格价格x34ppt课件研究地区经济增长GDP,受劳动力投入人数x1影响!还有:资本要素,科还有:资本要素,科技水平的影响技水平的影响 5ppt课件多元回归应用 例:财政收入y为因变量。自变量如下:x1工业总产值,x2农业总产值,x3建筑业总产值,x4人口数,x5社会商品零售总额。 例:股票价格Y,自变量为每股收益X1,每股帐面价值X2。 例:失业的时间长度Y(月),自变量有学历x1,年龄x2,工龄X3.6ppt课件多元回归模型 (multiple regression model)描述因变量 y 依赖于自变量 x1 , x2 , xk 和误差项 的方程,称为多元回归模型0 0 ,1
3、 1,2 2 ,k k是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 包含在包含在y y里面但不能被里面但不能被k k个自变量的线性关系所解释个自变量的线性关系所解释的变异性的变异性7ppt课件地区地区GDPGDP就业人员就业人员(万人)(万人)投资投资( (亿元亿元) ) 北北 京京 3663.10858.62169.26 天天 津津 2447.66419.71039.39 河河 北北 7098.563389.52477.98 山山 西西 2456.591469.51100.86 内蒙古内蒙古 2150.411005.21174.66 辽辽 宁宁 6002.541861.32
4、076.36 吉 林 2522.621044.6969.03 黑龙江 4430.001622.41166.18 多元回归样本数据多元回归样本数据8ppt课件多元多元回归模型回归模型n 1n (k 1)(k 1) 1n 1 YX模型矩阵表示模型矩阵表示i01i12i2ki,kiiid2iYXXX, N(0,)i1,2,.,n其中且01111k12212k21nn1nknkY1XXY1XXY1XX9ppt课件多元回归模型基本假定多元回归模型基本假定1. 误差项是一个期望值为0的随机变量,即E()=02. 对于自变量x1,x2,xk的所有值,的方差 2都相同3. 误差项是一个服从正态分布的随机变量,
5、即N(0, 2),且相互独立10ppt课件多多元线性回归方程元线性回归方程的形式为 E( y ) = 0+ 1 x1 + 2 x2 + k xk描述因变量 y 的平均值或期望值平均值或期望值如何依赖于自变量 x1, x2 ,xk的方程11ppt课件YX1X201122YXXSlope for variable X1Slope for variable X2多元回归方程几何意义Multiple Regression Equation12ppt课件最小二乘估计ppxxYE110)( 最小 SSE:2110YYSSExxYpp13ppt课件14ppt课件YX1X222110XbXbbYYi Yix2
6、ix1i The best fit equation, Y , is found by minimizing the sum of squared errors, e2 样本观测回归残差示意图Residual = i = (Yi Yi)15ppt课件普通最小二乘估计普通最小二乘估计对于随机抽取的n组观测值kjniXYjii, 2 , 1 , 0, 2 , 1),(如果样本函数的参数估计值已经得到,则有: KikiiiiXXXY22110i=1,2n根据最小二乘原理,参数估计值应该是下列方程组的解 0000210QQQQk其中2112)(niiiniiYYeQ2122110)(nikikiiiX
7、XXY16ppt课件于是得到关于待估参数估计值的正规方程组: kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110 解该(k+1)个方程组成的线性代数方程组,即可得到(k+1)个待估参数的估计值, , ,jjk 012 。17ppt课件正规方程组的矩阵形式nknkknkkiikikikiiiikiiYYYXXXXXXXXXXXXXXXXn212111211102112111111即YXX)X(由于XX满秩,故有 YXXX1)(18ppt课件多元回归方程模型系数由样本数据估计
8、得到i011i22ikkiYXXX估计值估计值Estimated (or predicted) value of Y斜率斜率Estimated slope coefficients截距截距Estimatedintercept用 Excel 计算得到回归系数19ppt课件馅饼Pie销售量sale,受价格price的影响。还受广告费Advertising 的影响20ppt课件馅饼销售Sales = 0 +1 (Price) +2 (Advertising)星期销售价格广告费WeekPie SalesPrice($)Advertising($100s)13505.503.324607.503.333
9、508.003.044308.004.553506.803.063807.504.074304.503.084706.403.794507.003.5104905.004.0113407.203.5123007.903.2134405.904.0144505.003.5153007.002.7Multiple regression equation:21ppt课件多元回归结果Regression StatisticsMultiple R0.72213R Square0.52148Adjusted R Square0.44172Standard Error47.46341Observations
10、15ANOVA dfSSMSFSignificance FRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Advertising74.1
11、309625.967322.854780.0144917.55303130.70888ertising)74.131(Adv ce)24.975(Pri - 306.526 Sales22ppt课件多元回归方程ertising)74.131(Adv ce)24.975(Pri - 306.526 Salesb1 = -24.975: 表明每表明每周销售量将减少,周销售量将减少,价格增加美元,价格增加美元,销售量平均减少销售量平均减少 24.975 个,(假个,(假设广告的效果不变)设广告的效果不变)b2 = 74.131: 表明销表明销售量增加,广告费售量增加,广告费增加美元,增加美元,销售平
12、均增加销售平均增加 74.131个周个周, (假设价格不变)(假设价格不变)23ppt课件用模型预测预测价格为$5.50 ,广告费为 $350:预测销量为 428.62 pies428.62 (3.5) 74.131 (5.50) 24.975 - 306.526 ertising)74.131(Adv ce)24.975(Pri - 306.526 Sales注意:单位百元,$350 意味 X2 = 3.524ppt课件模型的检验模型的检验系数的检验系数的检验拟合度检验决定系数拟合度检验决定系数25ppt课件误差平方和的分解误差平方和的分解越小越好越大越好假设不变26ppt课件多重判定系数-
13、可决系数-拟合优度(multiple coefficient of determination) 1. 回归平方和占总平方和的比例2. 计算公式为3. 因变量取值的变差中,能被多元回归方程所解释的比例 27ppt课件Regression StatisticsMultiple R0.72213R Square0.52148Adjusted R Square0.44172Standard Error47.46341Observations15ANOVA dfSSMSFSignificance FRegression229460.02714730.036.538610.01201Residual12
14、27033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888.5214856493.329460.0SSTSSRr2销量变化的销量变化的5
15、2.1% ,由价格和广告,由价格和广告因素解释因素解释决定系数28ppt课件 随着自变量个数的不断增加,会使得R2不断增加,因此在作拟合优度检验的判定时,一般采用调整的R2,以消除自变量的个数以及样本量的大小对R2的影响。TSSRSSpnnRTSSRSSTSSESSR11112229ppt课件修正多重判定系数修正多重判定系数(adjusted multiple coefficient of determination) 1. 为避免增加自变量而高估 R2,需要用样本量n和自变量的个数k去修正R2得到 计算公式为意义与 R2类似,数值小于R2目的是惩罚过多使用不重要的自变量目的是惩罚过多使用不重
16、要的自变量。用于比较多个模型用于比较多个模型30ppt课件Regression StatisticsMultiple R0.72213R Square0.52148Adjusted R Square0.44172Standard Error47.46341Observations15ANOVA dfSSMSFSignificance FRegression229460.02714730.0136.538610.01201Residual1227033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower
17、 95%Upper 95%Intercept306.52619114.253892.682850.0199357.58835555.46404Price-24.9750910.83213-2.305650.03979-48.57626-1.37392Advertising74.1309625.967322.854780.0144917.55303130.70888.44172r2adj销量变化的销量变化的44.2% 由价格和广告解释。由价格和广告解释。Adjusted r231ppt课件回归方程显著性F检验1.提出假设H0:12k=0 线性关系不显著H1:1,2, k至少有一个不等于0. 计算
18、检验统计量F3. 分子自由度k、分母自由度n-k-1得出统计量F,得到检验值4. 作出决策:确定显著性水平和比较,P 拒绝H0利用F统计量进行总体线性显著性检验32ppt课件6.53862252.814730.0MSEMSRFRegression StatisticsMultiple R0.72213R Square0.52148Adjusted R Square0.44172Standard Error47.46341Observations15ANOVA dfSSMSFSignificance FRegression229460.02714730.016.53860.01201Residu
19、al1227033.3062252.776Total1456493.333 CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Intercept306.52619114.253892.682850.019957.58835555.46404Price-24.9750910.83213-2.305650.039-48.576-1.3739Advertising74.1309625.967322.854780.014917.553130.70888总体线性显著性检验F Test for Overall SignificanceP-va
展开阅读全文