第十一章-多元线性回归和相关分析-《试验设计与统计分析》课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第十一章-多元线性回归和相关分析-《试验设计与统计分析》课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验设计与统计分析 第十一 多元 线性 回归 相关 分析 试验 设计 统计分析 课件
- 资源描述:
-
1、第十一章第十一章 多元线性回归和相关分析多元线性回归和相关分析第一节第一节 多元回归分析多元回归分析依变量依两个或两个以上自变量的回归,称依变量依两个或两个以上自变量的回归,称为多元回归或复回归为多元回归或复回归(multiple regression)主要内容:主要内容:1、确定各个自变量对依变量的综、确定各个自变量对依变量的综合效应和单独效应,即建立由各自变量描述合效应和单独效应,即建立由各自变量描述和预测依变量反应量的多元回归方程;和预测依变量反应量的多元回归方程;2、对、对上述综合效应和单独效应的显著性进行测验,上述综合效应和单独效应的显著性进行测验,建立最优多元回归方程;评价各自变量
2、对依建立最优多元回归方程;评价各自变量对依变量的相对重要性。变量的相对重要性。一、多元回归方程一、多元回归方程1、多元回归的线性模型和多元回归方程式、多元回归的线性模型和多元回归方程式一个一个m元线性回归元线性回归总体总体的线性模型为:的线性模型为:yj=0+1x1j+2x2j+mxmj+j其中,其中,jN(0,2)一个一个m元线性回归样本观察值的组成为:元线性回归样本观察值的组成为:yj=b0+b1x1j+b2x2j+bmxmj+ej同理一个同理一个m元线性回归方程可给定为:元线性回归方程可给定为:mmjxbxbxbby .22110b0是是x1、x2、xm都为都为0时时y的点估计值;的点估
3、计值;b1是是by1.23m的简写,它是在的简写,它是在x2,x3,xm皆皆保持一定时(取常量),保持一定时(取常量),x1每改变一个单位每改变一个单位时对时对y的的效应,称为效应,称为x2,x3,xm不变时,不变时,x1对对y的的偏回归系数偏回归系数(partial regression coefficient)。2、多元回归统计数的计算、多元回归统计数的计算多元线性回归资料的数据结构如下表:多元线性回归资料的数据结构如下表:变量变量组号组号 x1x2xm y1x11x12x1my12x21x22x2my2nxn1xn2xnm yn返回结构矩阵返回结构矩阵 m个自变量与依变量个自变量与依变量
4、y的回归方程为:的回归方程为:根据最小二乘法原理,根据最小二乘法原理,b0、b1、b2、bm应使全部应使全部观察值观察值y与回归估计值与回归估计值 的偏差平方和为最小,的偏差平方和为最小,即使即使 根据微分学中的极值原理,分别对根据微分学中的极值原理,分别对b0、b1、b2、bm偏导,并令其为偏导,并令其为0,即,即mmxbxbxbby .22110最小最小 2221102)()(mmxbxbxbbyyyQy 该方程组称为正规方程组,可尽一步化为该方程组称为正规方程组,可尽一步化为N b0+b1 x1+b2 x2+b3 x3+bm xm=yb0 x1+b1 x12+b2 x1x2+b3 x1x
5、3+bm x1xm=x1yb0 x2+b1 x1x2+b2 x22+b3 x2x3+bm x2xm=x2y b0 xm+b1 x1xm+b2 x2xm+b3 x3xm+bm xm2=xmy 0)(20)(20)(2221101221101221100mmmmQmmQmmQxxbxbxbbybSSxxbxbxbbybSSxbxbxbbybSS写成矩阵形式:写成矩阵形式:A b B 系数矩阵系数矩阵 偏回归系数矩阵偏回归系数矩阵 常数项矩阵常数项矩阵 yxyxyxybbbbxxxxxxxxxxxxxxxxxxxxxnmmmmmmmmm 2121022122221212121121即即 Ab=B系数
6、矩阵系数矩阵A=X X,n组数据的组数据的称为结构矩阵或数据矩阵称为结构矩阵或数据矩阵 nmnnmmxxxxxxxxxX212222111211111数据表数据表 nmnnmmnmmmmnnmmmmmmmxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxnA212222111211321232221213121112212222121212112111111111A为系数矩阵为系数矩阵 X XYXyyyyxxxxxxxxxxxxyxyxyxyBBBBBnnmmmmnnmm11111 3213212322212131211121210 B为常数项矩阵为常数项矩阵
7、 X Y这样一来,正规方程组的矩阵形式是这样一来,正规方程组的矩阵形式是(X X)b=X Y或或 Ab=B 其中其中b =(b0,b1,b2,bm)是正规方程组中是正规方程组中的未知数。在系数矩阵满秩的条件下的未知数。在系数矩阵满秩的条件下(这个这个条件在一般情况是容易满足的条件在一般情况是容易满足的),A的逆阵的逆阵存在,因而存在,因而b=A-1B=(X X)-1X YC=A-1=(X X)-1称为相关矩阵称为相关矩阵 mmmmmmmmijcccccccccccccccccAC2102222120112111000201001)(mmmmmmmmmmBBBBccccccccccccccccC
8、BBAbbbbb2102102222120112111000201001210(例例11.1)通过通过12个北方个北方春玉米杂交种的测定春玉米杂交种的测定数据数据(见表见表11.3),研究,研究在相同密度下每穗粒在相同密度下每穗粒数数(X1,粒,粒)、百粒重、百粒重(X2,g)、株高、株高(X3,cm)与每公顷玉米籽粒产与每公顷玉米籽粒产量量(Y,kg/hm2)的关系。的关系。试建立每穗总粒数、试建立每穗总粒数、百粒重、株高对每公百粒重、株高对每公顷玉米产量的多元线顷玉米产量的多元线性回归方程性回归方程;表表11.3 玉米杂交种每穗总粒数、百粒重、株玉米杂交种每穗总粒数、百粒重、株高与每公顷产
9、量高与每公顷产量杂交种杂交种编号编号每穗总粒每穗总粒数数(X1,粒,粒)百粒重百粒重(X2,g)株高株高(X3,cm)产量产量(Y,kg/hm2)1561.733.42949042.02504.140.32879744.03471.237.62908874.04476.637.02828833.55456.233.82788439.06513.635.32869058.57455.038.12928103.08594.531.02769343.59554.230.92888604.010493.730.12687287.011525.331.02777926.012571.224.128369
10、93.0解:解:用矩阵法求解多元线性回归方程用矩阵法求解多元线性回归方程 写出结构矩阵或数据矩阵写出结构矩阵或数据矩阵X及依变量列矩及依变量列矩阵阵Y 0.69930.97440.9042,2831.242.57112873.401.50412944.337.5611YX 利用公式利用公式A=X X,B=X Y,求得系数矩,求得系数矩阵阵A和常数项矩阵和常数项矩阵B 00.96453540.11427080.175059900.340140.11427018.1372634.20577760.40280.175059934.20577721.320424630.617700.340160.40
11、230.6177122831.242.57112873.401.50412944.337.56112832872941.243.404.332.5711.5047.561111XXA 求系数矩阵求系数矩阵A的逆矩阵的逆矩阵C 00.2900642755.345800395.5265006750.1022470.69930.97440.90422832872941.243.404.332.5711.5047.561111YXB 0022599832.00027431194.00001519486.04702658951.00027431194.00110223592.00006496311.00
12、732317438.00001519486.00006496311.00000794549.00196317484.04702658951.00732317438.00196317484.00135340670.141133323130232221201312111003020100AccccccccccccccccC求解偏回归系数矩阵求解偏回归系数矩阵b=(b0、b1、b2、bm)515.2965399-40238.150140214.94880990722829.29147-00.2900642755.345800395.5265006750.1022470022599832.000274
13、31194.00001519486.04702658951.00027431194.00110223592.00006496311.00732317438.00001519486.00006496311.00000794549.00196317484.04702658951.00732317438.00196317484.00135340670.1413210CBbbbbb即即 b0=2829.29147072,b1=14.94880992,b2=238.15014040,b3=15.29653995 写出线性回归方程写出线性回归方程式中:自变量式中:自变量X1对应的偏回归系数对应的偏回归系数
14、b1=14.9,表,表明在百粒重明在百粒重(X2)、株高、株高(X3)保持平均水平保持平均水平(=x2/n=403/12=33.55g;=x3/n=3401/12=283.4cm)时,每穗总粒数时,每穗总粒数(X1)每增加每增加1(粒粒),将使每公顷玉,将使每公顷玉米籽粒产量米籽粒产量(Y)平均增加平均增加14.9(kg);32132115.3-238.2 14.92 2829.3-515.2965399-40238.150140 214.9488099 0722829.29147-xxxyxxxy 成成:或或简简写写同理,同理,b2=238.2,表明在每穗总粒数,表明在每穗总粒数(X1)、株
15、、株高高(X3)保持平均水平保持平均水平(=x1/n=6177/12=514.8粒粒;=283.4cm)时,百粒重时,百粒重(X2)每增加每增加1(g),将,将使每公顷玉米产量使每公顷玉米产量(Y)平均增加平均增加238.2(kg);b3=15.3,表明在每穗总粒数,表明在每穗总粒数(X1)、百粒重、百粒重(X2)保保持平均水平持平均水平(=514.8粒粒;=33.55g)时,株高时,株高(X3)每增加每增加1(cm),将使每公顷玉米产量,将使每公顷玉米产量(Y)平均减平均减少少15.3(kg)。如果此回归关系是真实的。如果此回归关系是真实的(见下文见下文),则该方程可用于描述表则该方程可用于
16、描述表11.3的资料。但是,推的资料。但是,推断的量值处在观察值区间之内,才是可信的。断的量值处在观察值区间之内,才是可信的。X1的区间是的区间是455.0,594.5,X2的区间是的区间是24.1,40.3,X3的区间是的区间是268,294。二、多元线性回归的假设检验二、多元线性回归的假设检验1、多元回归方程的假设检验、多元回归方程的假设检验检验检验m个自变量综合对个自变量综合对Y的效应是否显著的效应是否显著,即检验即检验各自变量的总体偏回归系数各自变量的总体偏回归系数 j(j=1,2,)是是否同时为零。否同时为零。总变异平方和及自由度分解。总变异平方和及自由度分解。自由度自由度dfY=n
17、 1 nYYYnyyyySST/)1()()(2222 SSY=UY/12m+QY/12m dfY=dfU +dfQ 其中,离回归平方和(或剩余平方和)其中,离回归平方和(或剩余平方和)=Y Y b (X Y)自由度自由度dfQ=n (m+1)它与自变量它与自变量X无关,仅反映除依变量与无关,仅反映除依变量与m个自个自变量间存在线性关系以外的其他因素包括试变量间存在线性关系以外的其他因素包括试验误差所引起的变异。验误差所引起的变异。mjjjmjniiijjniimYBbyyxbyyyQ020112212)()(回归平方和回归平方和 =b (X Y)(1 Y)2/n 自由度自由度dfU=m。它是
18、由。它是由m个自变量个自变量Xj的不同的不同引起的,即是依变量引起的,即是依变量Y受受m个自变量综合线性个自变量综合线性影响所引起的变异影响所引起的变异 212/)(yyUmY F检验检验若若 F F (m,n m 1),那么我们可以在显著水,那么我们可以在显著水平平 下,认为多元线性回归方程是成立的,是下,认为多元线性回归方程是成立的,是有显著意义的。反之,有显著意义的。反之,F F0.01(3,8)=7.591,说明,说明P(H0)F0.01(1,8)=11.26;说明;说明H0:1=0、2=0应被否定,即每穗总粒数应被否定,即每穗总粒数(X1)、百粒、百粒重重(X2)对每公顷玉米产量对每
19、公顷玉米产量(Y)的偏回归都是极显著的。的偏回归都是极显著的。F3=0.85 F0.01(2,9)=8.02,表明,表明RY12极显著极显著(实际(实际P0.0002)。)。23.26)1212()9239.01(29239.0)1()1(22212212 mnRmRFYYR若用查若用查R 值法,则由值法,则由df2=n m 1=9与与M=m+1=2+1=3,查附表,查附表9得得R0.01(9,3)=0.800,因为因为RY12=0.9239 R0.01=0.800,故,故P 0.01,二元相关系数二元相关系数RY12极显著,与极显著,与F检验法结论完检验法结论完全一致。全一致。假设检验结果表
20、明:每公顷玉米籽粒产量假设检验结果表明:每公顷玉米籽粒产量(Y)与每穗总粒数与每穗总粒数(X1)、百粒重、百粒重(X2)之间存在极显之间存在极显著的二元线性相关关系。著的二元线性相关关系。二、偏相关二、偏相关1、偏相关系数的计算、偏相关系数的计算 由简单相关系数由简单相关系数rij构建相关系数矩阵构建相关系数矩阵R:求相关系数矩阵求相关系数矩阵R的逆矩阵的逆矩阵C:MMMMMMMMijrrrrrrrrrrR212222111211)(MMMMMMMMijcccccccccCRC2122221112111)(由下式计算偏相关系数由下式计算偏相关系数rij:例例11.5计算表计算表11.3资料的偏
展开阅读全文