书签 分享 收藏 举报 版权申诉 / 25
上传文档赚钱

类型12-线性回归分析2-PPT课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2694082
  • 上传时间:2022-05-18
  • 格式:PPT
  • 页数:25
  • 大小:261.01KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《12-线性回归分析2-PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    12 线性 回归 分析 PPT 课件
    资源描述:

    1、第12章 线性回归分析两变量间的关系 A 无关系无关系 B 有关系有关系 确定性关系:已知一个变量确定性关系:已知一个变量 能够精确求出另一个变量的值,两变量是能够精确求出另一个变量的值,两变量是完全对应的。如完全对应的。如I=U/R、V=S/T 非确定性关系:两变量存在某非确定性关系:两变量存在某种关系,但非完全的一一对应关系,而是种关系,但非完全的一一对应关系,而是具有某种趋势。例:正常人血压随年龄增具有某种趋势。例:正常人血压随年龄增高而增高,但不能讲某一年龄的人,他的高而增高,但不能讲某一年龄的人,他的血压一定是多少。血压一定是多少。 对于线性回归,若只有1个自变量,称为简单回归简单回

    2、归( (simple regression)simple regression); 若有2个或2个以上自变量,称为多重多重回归回归( (multiple regression)multiple regression)。 当这种数量关系为曲线关系时,称为曲线回归曲线回归/ /非线性回归非线性回归( (curve curve regression/nonlinear regression)regression/nonlinear regression)。 例例12-1 12-1 用某用某饲料喂养饲料喂养1212只只大白鼠大白鼠,得得出大白鼠出大白鼠的的进食进食量与量与体重增加体重增加量如表量如表1

    3、2-112-1,试绘其,试绘其散点图散点图. . 表表 12-1 12 只只大大白白鼠鼠的的进进食食量量(g)与与体体重重增增加加量量(g) 序号 进食量 X 体重增加量 Y X2 Y2 XY 1 305.7 23.6 93452.49 556.96 7214.52 2 188.6 14.7 3 277.2 19.2 4 364.8 27.7 5 285.3 18.9 6 244.7 16.1 7 255.9 17.2 8 149.8 12.9 9 268.9 18.3 10 247.6 17.7 11 168.8 13.7 12 200.6 15.6 40240.36 243.36 3129

    4、.36 合计 2957.9 x 215.6 y 770487.13 x2 4066.9 y2 55825.2 xy 由图12-1可见,体重增加量随进食量增加而增大且呈直线趋势,但并非12个点子恰好全都在一直线上。这与两变量间严格对应的函数关系不同,称为直线直线回归回归(linear regression)。直线回归是回归分析中最基本、最简单的一种,故又称简单回归简单回归(simple regression)。图12-1 12只大白鼠进食量与体重增加量散点图3.54.04.55.05.51.01.21.41.61.82.02.2进食量体重增加量YYX进 食 量400300200100体重增量28

    5、2624222018161412 回归方程的一般形式回归方程的一般形式: a为回归直线在为回归直线在Y轴上的截距轴上的截距( (intercept)intercept) ,即,即X=0时的时的Y的估计值。的估计值。 a0 表示回归直线与表示回归直线与Y轴的交点在原点上方轴的交点在原点上方 a0 Y随随X的增大而增大的增大而增大b0 Y随随X的增大而减小的增大而减小b=0 回归直线与回归直线与X轴平行,轴平行,Y与与X之之间无直线关系。间无直线关系。直线回归方程的求直线回归方程的求法法 用最小二乘法用最小二乘法(least square (least square method)method)求

    6、求a a、b b,使得各实测点到该,使得各实测点到该直线的纵向距离的平方和直线的纵向距离的平方和( (残差,剩残差,剩余平方和余平方和) )最小,可得最小,可得a a和和b b的计算公的计算公式:式:2XXYYXXllXXXYbXbYa 表表 12-1 12 只只大大白白鼠鼠的的进进食食量量(g)与与体体重重增增加加量量(g) 序号 进食量 X 体重增加量 Y X2 Y2 XY 1 305.7 23.6 93452.49 556.96 7214.52 2 188.6 14.7 3 277.2 19.2 4 364.8 27.7 5 285.3 18.9 6 244.7 16.1 7 255.9

    7、 17.2 8 149.8 12.9 9 268.9 18.3 10 247.6 17.7 11 168.8 13.7 12 200.6 15.6 40240.36 243.36 3129.36 合计 2957.9 x 215.6 y 770487.13 x2 4066.9 y2 55825.2 xy 求中间统计量lXX、l YY、 lXY9 .2957X6 .215Y1 .7704872X9 .40662Y2 .55825XY49.246X97.17Y直线回归方程的求解过程4 .41389)()(222nXXXXlXX6 .2681)()(222nYYYYlYY3 .193)()(nYXXY

    8、YYXXlXY3、按公式求a、b,并列出回归方程 则0648. 04 .41389/6 .2681/XXXYllbXY0648. 000. 200.249.2460648.097.17XbYa直线回归方程的图示在X的实测范围内任取相距较远且易读的两个X值,代入回归方程,求相应的 ,然后将这两点连成一条线即可。可用下列两点来核对图形绘制是否正确: 1、 所绘直线必通过点( 、 ) 2、此直线与Y轴交点的纵坐标等于a (直线是否在自变量X的实测范围内)XYY直线回归系数的假设检验直线回归系数的假设检验 b是是 的估计值,的估计值,b存在抽样误差,其存在抽样误差,其大小可用大小可用b的标准误的标准误

    9、Sb来表示。即使来表示。即使 =0,由于抽样误差的存在使所得,由于抽样误差的存在使所得b值也可能不为值也可能不为0,因此求得了,因此求得了b的大小的大小还应该作还应该作 =0的检验。具体有两种方的检验。具体有两种方法:方差分析法与法:方差分析法与t检验。检验。因变量Y的变异分解图示YYY YYYY YXY(一)、方差分析法(一)、方差分析法 P(X,Y)t lYY 的分解: 表示为: = +t 总总= 回回+ 剩剩 (总=n-1,回=1,剩=n-2)222YYYYYYSSSS总总SSSS回回SSSS剩剩YYYYYY SSSS总总是是Y Y的离均差平方和的离均差平方和, ,表示表示Y Y的总变异

    10、。的总变异。 SSSS回回表示在表示在Y Y的总变异中可用的总变异中可用X X来解释的部来解释的部分,即使分,即使得得总变异总变异 ( (Y- )Y- )2 2减少的那部减少的那部分分。 SSSS回回越大,说明回归效果越好。越大,说明回归效果越好。 SSSS回回= =blblXYXY= = SSSS剩剩表示在表示在Y Y的总变异中无法用的总变异中无法用X X解释的部解释的部分,即除了分,即除了X X对对Y Y的线性影响外,其它一的线性影响外,其它一切因素对切因素对Y Y变异的作用。变异的作用。XXlXYl2Y 将将SSSS总总分解为分解为SSSS回回与与SSSS剩剩两部分,两部分,SSSS回回

    11、越大越大表明回归效果越好表明回归效果越好,即,即X X对对Y Y 的影响越大;的影响越大; SSSS剩剩越小,说明各实测点到回归直线越近,越小,说明各实测点到回归直线越近,回归的估计误差越小。回归的估计误差越小。 比较回归均方和误差均方,计算检验统计比较回归均方和误差均方,计算检验统计量量F值值 回回=1=1, 剩剩= =n-2 n-2 剩回剩剩回回MSMSSSSSF/ H0:体重的增加量与进食量之间无直线关系体重的增加量与进食量之间无直线关系 ( =0) H1:体重的增加量与进食量之间有直线关系体重的增加量与进食量之间有直线关系 (0) =0.05 SS总总=lYY=193.3 SS回回=b

    12、lXY=lXY2/lXX=2681.62/41389.4=173.7 SS剩剩= SS总总- SS回回=193.3-173.7=19.6 回回=1, 剩剩=12-2=10 查查F F界值表,得界值表,得P0.001P0.001,所以按,所以按 =0.05=0.05水准拒绝水准拒绝H H0 0,接受,接受H H1 1,故可认,故可认为为体重的增加量与进食量之间有直线关系体重的增加量与进食量之间有直线关系 ,绘制回归直线绘制回归直线0.107980.86326.9080.745410.7454回归回归91.6086总总FMS SS6 .8810/6 .191/7 .173/剩剩回回SSSSF(二、

    13、)(二、)t 检验检验 当=0时,样本回归系数b服从正态分布 =剩=n-2 Sb为样本回归系数b的标准误,SY.X为剩余标准差,反映了因变量在扣除了自变量的线性影响后的离散程度。 XXlXYSbbSbt/.0222.nSSnYYXYS剩H0、H1及同方差分析,代入公式求得t=9.42,查t界值表得P0.001,结论同上。注意对同一份资料,F=t2,F检验与t检验所得的结论一致。回归系数的检验与相关系数的检验结论一致。直线回归方程的应用直线回归方程的应用 描述两变量在数量上的依存关系描述两变量在数量上的依存关系利用回归方程进行预测,也就是预报因利用回归方程进行预测,也就是预报因子子X等于某固定值

    14、等于某固定值X1时,预报量时,预报量Y的波动的波动范围(即范围(即Y的的1- 容许区间)容许区间)利用回归方程进行统计控制,如要求因利用回归方程进行统计控制,如要求因变量变量Y控制在一定范围内波动,可以通过控制在一定范围内波动,可以通过控制自变量控制自变量X的取值来实现。的取值来实现。 应用直线回归方程时注意:应用直线回归方程时注意:作回归分析要有实际意义。作回归分析要有实际意义。资料要求资料要求Y Y至少服从正态分布。至少服从正态分布。散点图呈直线趋势才做直线回归分析散点图呈直线趋势才做直线回归分析. . 如散如散点图明显呈曲线趋势,应先通过变量变换使点图明显呈曲线趋势,应先通过变量变换使之

    15、直之直 线化再作分析。线化再作分析。可提示资料有无异常可提示资料有无异常点点。回归方程必须作假设检验。回归方程必须作假设检验。若回归若回归/ /相关关系不显著,不绘制回归直线相关关系不显著,不绘制回归直线,以免引起误解。以免引起误解。 回归方程的应用范围只限于原数据自变量的回归方程的应用范围只限于原数据自变量的取值范围,不可任意延长回归直线,不能随取值范围,不可任意延长回归直线,不能随意意推算推算到原数据范围之外。到原数据范围之外。 由于同一资料中由由于同一资料中由X X推算推算Y Y与由与由Y Y推算推算X X的两个的两个直线回归方程不同,因此要根据专业知识正直线回归方程不同,因此要根据专业知识正确选定自变量。若两变量间有因果关系,应确选定自变量。若两变量间有因果关系,应以因为以因为X X;若无因果关系,则以较易被测量;若无因果关系,则以较易被测量者或可以严格控制者为者或可以严格控制者为X X。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:12-线性回归分析2-PPT课件.ppt
    链接地址:https://www.163wenku.com/p-2694082.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库