SAS多重线性回归课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SAS多重线性回归课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SAS 多重 线性 回归 课件
- 资源描述:
-
1、第3章 SAS多重线性回归主要内容主要内容1.多重线性回归模型简介多重线性回归模型简介2.回归系数的估计回归系数的估计3.方程的假设检验方程的假设检验4.决定系数与剩余标准差决定系数与剩余标准差5.偏回归系数的假设检验偏回归系数的假设检验6.指标的量化指标的量化7.回归与回归与 t 检验、方差分析的关系检验、方差分析的关系8.标准偏回归系数与自变量的贡献标准偏回归系数与自变量的贡献例例3.1 某地某地13岁男童身高,体重,肺活量的实测数据岁男童身高,体重,肺活量的实测数据(部分)(部分)编号编号身高(身高(cm)x1体重(体重(kg)x2肺活量(肺活量(L)y1135.132.01.75316
2、3.646.22.755156.237.12.757167.841.52.759145.033.02.5011165.549.53.0013153.341.02.7515160.547.22.2517147.640.52.0019155.144.72.7521143.031.51.7523160.840.42.7525158.237.52.0027144.534.72.2529156.532.01.75问题:问题:o身高、体重身高、体重 与与 肺活量肺活量有无线性关系?有无线性关系?o用身高和体重用身高和体重预测预测肺活量有多高的肺活量有多高的精度精度?o单独用身高、或体重是否也能达到同样效果
3、?单独用身高、或体重是否也能达到同样效果?o身高的贡献大,还是体重的贡献大?身高的贡献大,还是体重的贡献大?3.1 多重线性回归模型简介多重线性回归模型简介o多重回归多重回归nmultiple regressionnmultiple linear regressiono因变量因变量n dependent variablen response variable(响应变量)(响应变量)o自变量自变量n independent variablen explanatory variable(解释变量)(解释变量)回归模型回归模型o因变量因变量y,自变量为自变量为x1,x2,xmoa为截距(为截距(in
4、tercept),又称常数项),又称常数项(constant),表示各自变量均为),表示各自变量均为0时时y的估的估计值计值obi 称为偏回归系数称为偏回归系数(partial regression coefficient),),简称为回归系数简称为回归系数o 称为称为 y 的估计值或预测值的估计值或预测值(predicted value)1221mmyaxb xxbby 例例3.1 o根据某地根据某地29名名13岁男童的身高岁男童的身高x1(cm),体),体重重x2(kg)和肺活量)和肺活量y(L)建立的回归方程)建立的回归方程为:为:2105406.0005017.05657.0 xxy
5、yo当当x1=150,x2=32时,时,=1.9168,表示对所有身高为表示对所有身高为150cm,体重为,体重为32kg的的13岁男童,估计平均肺活量为岁男童,估计平均肺活量为1.9168(L)o回归模型还可表示为:回归模型还可表示为:oe 称为残差(称为残差(residual)o多重线性回归需要满足:多重线性回归需要满足:o x 和和y之间的关系是线性的之间的关系是线性的oCov(ei,ej)=0;独立性;独立性oeN(0,2);正态性);正态性Var(ei)=2;方差齐性;方差齐性1221mmyyeaxb xb xebo用矩阵表示为:用矩阵表示为:Y=XB+E Y是应变量向量;是应变量向
6、量;X称为设计矩阵(称为设计矩阵(design matrix),),B是回归系数向量;是回归系数向量;E是残差向量是残差向量3.2 回归系数的估计回归系数的估计o最小二乘法(最小二乘法(least square,LS)o残差平方和(残差平方和(sum of squares for residuals)最小最小 nimminiiixbxbxbbyyyQ122211012 o回归系数的矩阵计算:回归系数的矩阵计算:B=(XX)-1 XYo高斯高斯-马尔科夫马尔科夫定理:最小二乘估计是方差定理:最小二乘估计是方差最小的线性无偏估计量(最小的线性无偏估计量(best linear unbiased e
7、stimate,BLUE)oR例例3.1 o建立的回归方程为:建立的回归方程为:2105406.0005017.05657.0 xxy o将每个男童的身高将每个男童的身高x1(cm),体重),体重x2(kg)代入方程就能获得代入方程就能获得 y 的估计值,以及的估计值,以及y和和y 的的估计值之差(残差)估计值之差(残差)表表3.2 估计值与残差估计值与残差 编号编号ye编号编号ye11.751.8420-0.092022.001.77960.220432.752.7527-0.002742.501.98030.519752.752.22360.526462.002.1381-0.138172
8、.752.51960.230481.501.8612-0.361292.501.94580.5542102.252.19040.0596113.002.94060.0594121.251.6037-0.3537132.752.41990.3301141.751.9268-0.1768152.252.7912-0.5412161.751.9318-0.1818172.002.3643-0.3643182.252.5653-0.3153192.752.62890.1211202.002.2668-0.2668211.751.8546-0.1046222.252.01650.2335232.752.
9、42510.3249242.502.31330.1867252.002.2552-0.2552261.752.1330-0.3830272.252.03510.2149282.502.34530.1547291.751.9494-0.1994y y 估计值与残差有下列性质:估计值与残差有下列性质:0)(11 niiniiieyy niiniiieyy1212)(3.3 方程的假设检验方程的假设检验o未引进回归时的总变异:未引进回归时的总变异:(sum of squares about the mean of Y)o引进回归以后的变异(剩余)引进回归以后的变异(剩余):(sum of squar
10、es about regression)o回归的贡献,回归平方和:回归的贡献,回归平方和:(sum of squares due to regression)2)(YY 2)(YY 2)(YY表表3.3 回归方程的方差分析表回归方程的方差分析表 QUmmn1变异来源变异来源SS自由度自由度MSF总总lyyn-1回归回归UmU/m剩余剩余Qn-m-1Q/(n-m-1)表表3.4 资料回归方程的方差分析资料回归方程的方差分析 变异来源变异来源SS自由度自由度MSFP总总5.6336206928回归回归3.0757339421.5378669715.63190.0000剩余剩余2.557886852
11、60.09838026H0:总体偏回归系数全为:总体偏回归系数全为0H1:总体偏回归系数不全为:总体偏回归系数不全为03.4 决定系数与剩余标准差决定系数与剩余标准差o决定系数(决定系数(determination coefficient)yyyylQlUR 12R2可用于检验多重回归方程的显著性:可用于检验多重回归方程的显著性:oH0:2=0;oH1:2 0。o检验统计量为:检验统计量为:)1,(2211 mnmFmmnRRF 复相关系数复相关系数R的性质的性质 o0R1。o当只有一个因变量当只有一个因变量y与一个自变量与一个自变量x时,时,R就等就等于于y与与x的简单相关系数之绝对值:的简
12、单相关系数之绝对值:R=|ryx|o当有多个自变量当有多个自变量x1,x2,xm时,时,R的值比的值比任何一个自变量与因变量的简单相关系数之任何一个自变量与因变量的简单相关系数之绝对值大,即:绝对值大,即:myxyxyxrrrR,max21 剩余标准差剩余标准差 o 剩余标准差剩余标准差 mxxxys21 111212 mnQmnyysniiimy剩余标准差的用途剩余标准差的用途o剩余标准差可用于偏回归系数的假设检验剩余标准差可用于偏回归系数的假设检验o y的容许区间估计的容许区间估计o y的可信区间估计的可信区间估计o自变量的选择等自变量的选择等 因此,剩余标准差在回归分析中是一个非常因此,
13、剩余标准差在回归分析中是一个非常重要的统计量重要的统计量3.5 偏回归系数的假设检验偏回归系数的假设检验oH0:i=0;oH1:i 0。)1(mnbiitsbti o 为偏回归系数的标准误:为偏回归系数的标准误:121ibymiisscCX XibsR的输出结果的输出结果Coefficients:Estimate Std.Error t value Pr(|t|)(Intercept)-0.565664 1.240127 -0.456 0.65208 x1 0.005017 0.010575 0.474 0.63920 x2 0.054061 0.015984 3.382 0.002283.6
14、 标准偏回归系数与自变量的贡献标准偏回归系数与自变量的贡献iiiiyyiiiylbblsbbs .reg y x1 x2,beta Source|SS df MS Number of obs=29-+-F(2,26)=15.63 Model|3.07573394 2 1.53786697 Prob F =0.0000 Residual|2.55788675 26 .098380259 R-squared =0.5460-+-Adj R-squared=0.5110 Total|5.63362069 28 .201200739 Root MSE =.31366-y|Coef.Std.Err.t
15、P|t|Beta-+-x1|.0050165 .0105754 0.47 0.639 .0935215 x2|.0540611 .0159838 3.38 0.002 .6668242 _cons|-.5656643 1.240127 -0.46 0.652 .-一元回归分析的结果一元回归分析的结果-y|Coef.Std.Err.t P|t|95%Conf.Interval-+-x1|.0315609 .0083471 3.78 0.001 .0144341 .0486878 _cons|-2.608541 1.275414 -2.05 0.051 -5.225474 .008393-y|Co
16、ef.Std.Err.t P|t|95%Conf.Interval-+-x2|.0596878 .0105587 5.65 0.000 .0380232 .0813524 _cons|-.0091673 .3961987 -0.02 0.982 -.8221 .8037653-为什么单变量分析时都有统计学意义,而同时放入为什么单变量分析时都有统计学意义,而同时放入方程则一个有统计学意义,另一个无统计学意义?方程则一个有统计学意义,另一个无统计学意义?自变量的作用自变量的作用X1 YX2自变量作用的分解自变量作用的分解 自变量自变量中间中间变量变量直接贡献直接贡献间接贡献间接贡献与与y的相关的相
17、关riy身高身高x1x2b1=0.09352b2r12=0.666820.7421=0.49480.5884体重体重x2x1b2=0.66682b1r12=0.093520.7421=0.06940.73623.8 指标的量化指标的量化 o性别性别 如果是男性如果是女性 10 xxbbY10 例例 t 检验与回归的关系检验与回归的关系正常人组正常人组II期矽肺组期矽肺组64.26 74.9742.84 88.0652.48 93.4748.19 95.1080.22100.6769.61101.1418.19113.5250.90正常人与矽肺患者血清粘蛋白合理(mg/100mg)资料重新整理资
18、料重新整理 y group 1.64.26 0 2.42.84 0 3.52.48 0 4.48.19 0 5.80.22 0 6.69.61 0 7.18.19 0 8.50.9 0 9.74.97 1 10.88.06 1 11.93.47 1 12.95.1 1 13.100.67 1 14.101.14 1 15.113.52 1 回归分析结果回归分析结果.reg y group Source|SS df MS Number of obs=15-+-F(1,13)=25.49 Model|6566.62918 1 6566.62918 Prob F =0.0002 Residual|3
19、349.50389 13 257.654145 R-squared =0.6622-+-Adj R-squared=0.6362 Total|9916.13307 14 708.29522 Root MSE =16.052-y|Coef.Std.Err.t P|t|95%Conf.Interval-+-group|41.93946 8.307497 5.05 0.000 23.99221 59.88672 _cons|53.33625 5.675101 9.40 0.000 41.07594 65.59656-53.3362541.93946ygroup回归系数与各组均数的关系回归系数与各组均
20、数的关系53.3362541.939460 53.336251:53.3362541.9394695.27571ygroupgroupygroupy:指标的量化指标的量化 o血型(血型(A,B,AB,O)ox1=0,x2=0,x3=0 表示表示O型型ox1=1,x2=0,x3=0 表示表示A型型ox1=0,x2=1,x3=0 表示表示B型型ox1=0,x2=0,x3=1 表示表示AB型型哑变量(哑变量(dummy),又称指示变量(),又称指示变量(indicator variables)3322110 xbxbxbbY 方差分析与回归分析方差分析与回归分析正常人组正常人组I期矽肺组期矽肺组II
展开阅读全文