《回归与相关》课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《回归与相关》课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归与相关 回归 相关 课件
- 资源描述:
-
1、 直线回归与相关 linear regression and correlation回归分析与相关分析回归分析与相关分析双变量间关系双变量间关系:年龄年龄身高、肺活量身高、肺活量体重、药物体重、药物剂量与动物死亡率等剂量与动物死亡率等。(1)依存关系依存关系:应变量:应变量(dependent variable)Y随自变量随自变量(independent variable)X变化而变化。变化而变化。回归分析回归分析(2)互依关系互依关系:应变量应变量Y与自变量与自变量 X间间的彼此关系的彼此关系 相关分析相关分析双变量计量资料:双变量计量资料:每个个体有两个变量值每个个体有两个变量值 总体:总
2、体:无限或有限对变量值无限或有限对变量值 样本:样本:从总体随机抽取的从总体随机抽取的n n对变量值对变量值(X1,Y1),(X2,Y2),(Xn,Yn)目的:目的:研究研究X X和和Y Y的数量关系的数量关系 方法:方法:回归与相关回归与相关 简单、基本简单、基本直线回归、直线相关直线回归、直线相关“一因一果一因一果”,即一个自变量与一个依变量一元,即一个自变量与一个依变量一元回归分析;回归分析;研究研究“多因一果多因一果”,即多个自变量与一个依变,即多个自变量与一个依变量的回归分析称为多元回归分析。量的回归分析称为多元回归分析。一元回归分析又分为直线回归分析与曲线回归一元回归分析又分为直线
3、回归分析与曲线回归分析两种;分析两种;多元回归分析又分为多元线性回归分析与多元多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。非线性回归分析两种。(linear regression 线性回归线性回归)1直线回归的概念:直线回归的概念:直线回归是分析直线回归是分析两变量间两变量间线性依存变化的线性依存变化的 数量关系。数量关系。2.“回归回归”的由来的由来7570656075706560height of fatherheight of son儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系:。也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个
4、子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”。33.730.516YX目前,“回归”已成为表示变量之间某种数量依存关系的统计学术语,并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。3.:确定。例如确定。例如 园周长与半径:园周长与半径:y=2r:不确定。例如血压和年龄的关系,:不确定。例如血压和年龄的关系,直线回归直线回归的任务就是找出一条最能描述变量的任务就是找出一条最能描述变量间非确定性数量关系的一条直线,此直线为间非确定性数量关系的一条直线,此直线为回归直线,相
5、应的直线方程称为回归直线,相应的直线方程称为直线回归方程直线回归方程(linear regression equation)。对资料的要求:对资料的要求:自变量自变量 x正态总体中的随机变量或指定变正态总体中的随机变量或指定变量量 因变量因变量 y服从正态分布的随机变量服从正态分布的随机变量1.51.51.61.61.71.71.81.81.91.92 22.12.12.22.22.32.32.42.42.52.52.62.62.72.72.82.82.92.930303232343436363838404042424444 体重(体重(kg),),x肺活量(肺活量(),YL十名女中学生体重与
6、肺活量散点图十名女中学生体重与肺活量散点图/(,Y XY XXa b 4.直线回归方程的表达式为截矩;为斜率;均为总体参数)用样本数据建立的方程失Y=a+bX,Y是的一个样本估计值,称预测值,分别是 和 的样本估计值.a为常数项,是截矩;b为回归系数,即直线的斜率。为回归直线在为回归直线在 y 轴上的截距轴上的截距a 0a=0a 0b=0b 0,Y随随X的的增大增大而而增大(减少增大(减少 而而减少)减少)斜上;斜上;b0,Y随随X的的增大增大而而减小(减少减小(减少 而而增加)增加)斜下;斜下;b=0,Y与与X无直线关系无直线关系 水平水平。b越大,表示越大,表示Y随随X变化越快,直线越陡峭
7、。变化越快,直线越陡峭。5直线回归方程参数的计算直线回归方程参数的计算 y=a+bx 最小二乘法原则最小二乘法原则 (least square method):使各实际:使各实际散点(散点(Y)到直线()到直线()的纵向距离的平方和最小。)的纵向距离的平方和最小。即使即使 (残差或剩余值)最小。(残差或剩余值)最小。2YYYYi (Y的估计值)=a+bXi Yi估计值i残差i=Yi 估计值i残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离 。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。XXXYllnXXnYXXYXXYYXXb/)()(2
8、22XbYaniiiniiibXaYYYYYQ12122)()(例:用某饲料喂养例:用某饲料喂养12只大白鼠,得出大白鼠的进只大白鼠,得出大白鼠的进食量与体重增加量结果,试作直线回归分析食量与体重增加量结果,试作直线回归分析。(1).由原始数据作散点图,观察两变量间的趋势图 12-1 12只大白鼠进食量与体重增重量散点图图 12-1 12只大白鼠进食量与体重增重量散点图51015202530130180230280330380进食量(g),X体重增加量(g),Y序号 进食量(g)X 体重增加量(g)Y 2X 2Y XY(1)(2)(3)(4)(5)(6)1 305.7 23.6 93452.4
9、9 556.96 7214.52 2 188.6 14.7 35569.96 216.09 2772.42 3 277.2 19.2 76839.84 368.64 5322.24 4 364.8 27.7 133079.04 767.29 10104.96 5 285.3 18.9 81396.09 357.21 5392.17 6 244.7 16.1 59878.09 259.21 3939.67 7 255.9 17.2 65484.81 295.84 4401.48 8 149.8 12.9 22440.04 166.41 1932.42 9 268.9 18.3 72307.21
10、334.89 4920.87 10 247.6 17.7 61305.76 313.29 4382.52 11 168.8 13.7 28493.44 187.69 2312.56 12 200.6 15.6 40240.36 243.36 3129.36 合计 2957.9(X)215.6(Y)770487.13)(2X 4066.9)(2Y 55825.2(XY)12只大白鼠的进食量(只大白鼠的进食量(g)与体重增加量)与体重增加量(g)测量结果测量结果(2).计算X、Y的均数X、Y,离均差平方和lXX、lYY与离均差积和lXYab(3).(4).Y =2+0.0648X(5).按求得的直
11、线回归方程,在X实际范围内任意取两点(X1,Y1),(X2,Y2),相连即得回归直线。Y =Y+b(x-x)6.回归系数的假设检验回归系数的假设检验建立样本直线回归方程,只是完成了统计分析两变量关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实存在,即是否对总体有?0 YYYYYYY回归部分)(YY)(YY 总情况Y剩余部分)(YY 实测点),(YXPYX X222()()()()()()YYYYYYYYYYYYSSSSSS总剩回总剩回可有数学证明得到:即同样有:222222()()()()()()()XXYYXYXYXlXXXnYlYYYnXYlXXYYXYnSSblSSSS
12、SS回剩总回推断总体回归系数推断总体回归系数 是否为是否为0,确定所求得的回归方程是否成确定所求得的回归方程是否成 立立。|b-0|bt=,=n-2 S b S b S yxS b=,_ (x-x)2 _ S b 为样本回归系数标准误为样本回归系数标准误S yx 为剩余标准差为剩余标准差方差分析法12SSMSFnSSMS回回回回剩剩剩剩;,t检验法 r-0 rt r=,S r 1-r 2 n-2_ =n-2 (y-y)2 Syx=n-2=l yy-b l xy (y-)2 =(y-y)2-(x x)(y y)2(x x)2同一组资料作直线相关与回归时同一组资料作直线相关与回归时 tb 与与 t
展开阅读全文