书签 分享 收藏 举报 版权申诉 / 121
上传文档赚钱

类型第七章直线回归相关分析课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2993417
  • 上传时间:2022-06-20
  • 格式:PPT
  • 页数:121
  • 大小:2.05MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第七章直线回归相关分析课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第七 直线 回归 相关 分析 课件
    资源描述:

    1、直线相关与回归分析.复习复习1 1、方差分析的用途。方差分析的用途。2 2、方差分析的基本思路方差分析的基本思路3 3、方差分析的出发点方差分析的出发点4 4、方差分析的步骤方差分析的步骤5 5、单因素方差分析中单因素方差分析中SS SS T T、SS SS t t、SS SS e e的含义及的含义及三者的关系。三者的关系。.第九章第一节第二节第三节回归与相关的概念直线回归直线相关本章节内容本章节内容.第一节:回归与相关的概念 前面各章我们讨论的问题,都只涉及到一前面各章我们讨论的问题,都只涉及到一个变量,如体重个变量,如体重 、日增重、产仔数、体温、日增重、产仔数、体温、血糖浓度血糖浓度 、

    2、产奶量、产奶量 、产毛量或孵化率、产毛量或孵化率 、发病、发病率等。率等。 但是,由于客观事物在发展过程中相但是,由于客观事物在发展过程中相互联系、相互影响,因而在生物学研究中常常互联系、相互影响,因而在生物学研究中常常要研究两个或两个以上变量间的关系。要研究两个或两个以上变量间的关系。 . 一、确定的函数关系:一、确定的函数关系:变量间存在着完全确变量间存在着完全确定性的一一对应关系,可以用精确的数学表达式来定性的一一对应关系,可以用精确的数学表达式来表示。表示。 二、不完全确定的函数关系:二、不完全确定的函数关系:变变 量量 间不存在完全间不存在完全的确定性关系,不能用精确的数学公式来表示

    3、的确定性关系,不能用精确的数学公式来表示,统计统计学中把这些变量间的关系称为学中把这些变量间的关系称为协变关系协变关系(相关关系相关关系),把存在协变关系的变量称为把存在协变关系的变量称为协变量协变量(相关变量相关变量)。 研究两个或两个以上变量间的关系有两类:研究两个或两个以上变量间的关系有两类: .相相关关变变量量因果关系因果关系平行关系平行关系一个变量的变化受另一个变一个变量的变化受另一个变量或几个变量的制约。量或几个变量的制约。两个以上变量之间两个以上变量之间互为因果互为因果或或共同受到另外因素的影响。共同受到另外因素的影响。.1 1、回归分析、回归分析 (regression ana

    4、lysisregression analysis) 研究呈因果关系的相关变量间的关系。表示原研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。因的变量称为自变量,表示结果的变量称为依变量。 一因一果,一元回归分析一因一果,一元回归分析 一个自变量与一个依变量的回归分析,分为一个自变量与一个依变量的回归分析,分为直线回归分析与曲线回归分析两种。直线回归分析与曲线回归分析两种。多因一果,多元回归分析多因一果,多元回归分析 多个自变量与一个依变量的回归分析,分为多个自变量与一个依变量的回归分析,分为多元线性回归分析与多元非线性回归分析两种。多元线性回归分析与多元非

    5、线性回归分析两种。. .2、相关分析、相关分析 ( correlation analysis) 研究呈平行关系的相关变量之间的关系。研究呈平行关系的相关变量之间的关系。 简单相关分析:简单相关分析: 对两个变量间的直线关系进行相关分析,也称为对两个变量间的直线关系进行相关分析,也称为直线相关分析。直线相关分析。复相关分析:复相关分析: 对多个变量进行相关分析时,研究一个变量与多对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关;个变量间的线性相关; 偏相关分析:偏相关分析: 研究其余变量保持不变的情况下两个变量间的线研究其余变量保持不变的情况下两个变量间的线性相关。性相关。. 函数关

    6、系 有精确的数学表达式 (确定性的关系) 直线回归分析 一元回归分析 变量间的关系 因果关系 曲线回归分析 (回归分析) 多元线性回归分析 多元回归分析 相关关系 多 元 非 线 性 回 归 分 析 (非确定性的关系) 简单相关分析 直线相关分析 平行关系 复相关分析 (相关分析) 多元相关分析 偏相关分析 .第二节:直线回归第二节:直线回归 Linear Regression一、直线回归方程的建立一、直线回归方程的建立二、直线回归的数学模型和基本假定二、直线回归的数学模型和基本假定三、直线回归的假设检验三、直线回归的假设检验四、直线回归的区间估计四、直线回归的区间估计.一、直线回归方程的建立

    7、一、直线回归方程的建立 。.两个变量间关系的性质(正向协同变化或负向协同变化)和两个变量间关系的性质(正向协同变化或负向协同变化)和程度(关系是否密切)程度(关系是否密切)两个变量间关系的类型(直线型或曲线型)两个变量间关系的类型(直线型或曲线型)是否有异常观测值的干扰是否有异常观测值的干扰 .X 每一个取值都有每一个取值都有 Y 的一个正态分布与之对应。的一个正态分布与之对应。由于依变量由于依变量y的实际观测值总是带有随机误差,因的实际观测值总是带有随机误差,因而依变量而依变量y的实际观测值的实际观测值yi可用自变量可用自变量x的实际观测值的实际观测值xi表示为:表示为:iiixy2 2、直

    8、线回归的数学模型、直线回归的数学模型.总体线性回归模型的图示YXiiixy ixyx 观察值观察值.总体线性回归模型总体线性回归模型iiixy yx.为了描述为了描述X与与Y间的数量关系,必须找出一个能代表间的数量关系,必须找出一个能代表Y的的值与值与i对应,这个代表值只能是当对应,这个代表值只能是当X=i时,时,Y的平均数的平均数y/X= i。y/X= i称为称为Y的条件平均数。的条件平均数。如何估计如何估计y/X= i是直线回归所要解决的问题。是直线回归所要解决的问题。. 根据回归方程所画出的直线称为回归线,根据回归方程所画出的直线称为回归线,b是直线是直线的斜率,称为回归系数。的斜率,称

    9、为回归系数。 怎样通过实际观测值得到总体回归怎样通过实际观测值得到总体回归 和和 的最好点估计值的最好点估计值a和和b?.bxay最小二乘估计法最小二乘估计法a.建立建立 样本线性回归方程的方法样本线性回归方程的方法最小二乘法最小二乘法xy e1e2e3e4yyiiiniine1221 原则:回归直线是指所有直线中最接近散点图全部散点的直原则:回归直线是指所有直线中最接近散点图全部散点的直线,即最好的直线是使总的估计误差达到最小的直线。线,即最好的直线是使总的估计误差达到最小的直线。.nyy12)(nnbxayyyQ1212)()(最小最小最小二乘法(method of least squar

    10、e)a、b应使回归估计值与实际观测值的误差平方和最小,即:应使回归估计值与实际观测值的误差平方和最小,即:22()()Qyyyabx最小最小 这种使估计误差平方之和达最小的参数估计方法称为最小这种使估计误差平方之和达最小的参数估计方法称为最小二乘法。二乘法。.0)(2bxayaQ0)(2xbxaybQ令令 Q对对a、b的一阶偏导数等于的一阶偏导数等于0,即:,即: 整理得关于整理得关于a、b的正规方程组的正规方程组: yxbanxyxbxa2解正规方程组,得:解正规方程组,得: xbyaxxySSSPxxyyxxb2)()(.xbyaxxySSSPxxyyxxb2)()( 自变量自变量 x 的

    11、离均差与依变量的离均差与依变量y 的离均差的乘积和。的离均差的乘积和。2)(xx)(yyxx a 叫做样本回归截距,是总体回归截距的最小二乘估叫做样本回归截距,是总体回归截距的最小二乘估计值也是无偏估计值,是回归直线与计值也是无偏估计值,是回归直线与y轴交点的纵坐标,轴交点的纵坐标,当当 x = 0时,时, y = a; 简称乘积和简称乘积和 ,记作,记作 SPxy 或或Ssxy 。 简称简称SSX 。 b 叫做样本回归系数,表示叫做样本回归系数,表示 x 改变一个单位,改变一个单位,y 平均平均改变的数量;改变的数量;b 的符号反映了的符号反映了x影响影响y的性质,的性质,b的绝对值的绝对值

    12、大小反映了大小反映了 x 影响影响 y 的程度的程度;.bxaynyyQ12)(为最小值0)(yy),(yx基本性质.变量变量1变量变量2收集数据收集数据散点图温度天数 X Y平均温度() 历期天数(d ) 11.8 30.1 14.7 17.3 15.6 16.7 16.8 13.6 17.1 11.9 18.8 10.7 19.5 8.3 20.4 6.7. X Y平均温度() 历期天数(d ) 11.8 30.1 14.7 17.3 15.6 16.7 16.8 13.6 17.1 11.9 18.8 10.7 19.5 8.3 20.4 6.77 .134x19.23232x3 .11

    13、5y03.20392y8n8375.16nxx4125.14nyy.1788.55)()(222xxnxxSSx2688.377)()(222yynyySSy6937.139)( )()( )(yyxxnyxxySPxy5317.2xxySSSPb0400.57xbyaxy5317. 20400.57.0 010102020303040401010121214141616181820202222温度温度天数(天)天数(天)()xy5317. 20400.5711.8-20.4b b的生物学意义:的生物学意义:当温度提高一个单位时,历期缩短当温度提高一个单位时,历期缩短2.53172.5317天

    14、。天。a a的生物学意义:的生物学意义:当温度为当温度为0 0时,历期是时,历期是57.0457.04天。天。根据直线回归方程可作出回归直线,见图。从图看出,并不是根据直线回归方程可作出回归直线,见图。从图看出,并不是所有的散点都恰好落在回归直线上,这说明所有的散点都恰好落在回归直线上,这说明用用 去估计去估计y是有偏是有偏差的。差的。y .二、直线回归的假设检验bxay有意义有意义指导实践指导实践?是否真正存在线性关系是否真正存在线性关系回归关系是否显著回归关系是否显著.(一)对回归方程的(一)对回归方程的F检验检验1、直线回归的变异来源、直线回归的变异来源yy-y实际值与估计值之差,剩余或

    15、残差。y-y估计值与均值之差,它与回归系数的大小有关。y=a+bxy-yy-y(x,y)22) ()()(yyyyyy)y (y)yy (22)y (y2)yy (0)()()()()() ( )(22xxxxxySSSSSPSPSSSPSSbbSPxxbyyxxbyyyy222) ()()(yyyyyy.依变量依变量 y 的平方和,总平方和,记的平方和,总平方和,记SST或或SS总。总。回归平方和回归平方和 U SSR离回归平方和离回归平方和 Q SSE222) ()()(yyyyyy.y y的离均差,反映了的离均差,反映了y y的总变异程度,称为的总变异程度,称为y y的总平方和。的总平方

    16、和。说明未考虑说明未考虑x x与与y y的回归关系时的回归关系时y y的变异。的变异。2)(yyTSS 它反映在它反映在y的总变异中由于的总变异中由于x与与y的直线关系,而使的直线关系,而使y变变异减小的部分,异减小的部分,在总平方和中可以用在总平方和中可以用x解释的部分解释的部分。 SSR(U U)值大,说明回归效果好。)值大,说明回归效果好。为由为由x变异引起变异引起y变异的平方和,称回归平变异的平方和,称回归平方和方和(regression sum of squares) U SSR2)( yy.误差因素引起的平方和,反映了除去误差因素引起的平方和,反映了除去x x与与y y的直线回归关

    17、的直线回归关系以外的其余因素使系以外的其余因素使y y引起变化的大小。引起变化的大小。反映反映x x对对y y的线性影响之外的一切因素对的线性影响之外的一切因素对y y的变异的作的变异的作用,也就是在总平方和中无法用用,也就是在总平方和中无法用x x解释的部分。解释的部分。离回归平方,误差平方和,残差(剩余)离回归平方,误差平方和,残差(剩余)平方和平方和(residual sum of squares)SS(residual sum of squares)SSE E Q Q在散点图上,各实测点离回归直线越近,在散点图上,各实测点离回归直线越近,SSE (Q Q)值越小,说明直线回归的估计误差

    18、越小。值越小,说明直线回归的估计误差越小。2) ( yy.222) ()()(yyyyyyQUSSTERTSSSSSSxxySSSPb xRSSbxxbyxxbyyySSU22222)()()(2) (yyQRTESSSSSSQxxyRSSSPSSU2.直线回归分析中,回归自由度等于自变量直线回归分析中,回归自由度等于自变量的个数,只涉及到的个数,只涉及到1 1个自变量个自变量df回归1df总n-1df离回归n-2ERTdfdfdf.2/nSSsExyQ/n-2Q/n-2离回归标准差离回归标准差回归估计标准误回归估计标准误剩余标准差剩余标准差离回归方差离回归方差.两个变量是否存在线性关系,可采

    19、用两个变量是否存在线性关系,可采用F F检验检验法进行。法进行。总体回归截踞总体回归截踞总体回归系数总体回归系数随机误差随机误差若若x x与与y y间间不存在直线关系不存在直线关系,则总体回归系数,则总体回归系数=0=0; ; 若若x x与与y y间间存在直线关系存在直线关系,则总体回归系数,则总体回归系数00iiixy .假 设H H0 0: :两变量间两变量间无无线性关系线性关系H HA A: :两变量间两变量间有有线性关系线性关系在无效假设存在下,回归方差与离回归在无效假设存在下,回归方差与离回归方差的比值服从方差的比值服从F F分布。分布。)2(2/1/nSSSSnSSSSFERERd

    20、f1= 1df2= n-22、F显著性检验显著性检验.H H0 0: :黏虫孵化历期平均温度黏虫孵化历期平均温度x x与历期天数与历期天数y y之之间间 不存在不存在线性关系线性关系H HA A: :两变量间两变量间有有线性关系线性关系变异来源 df SS s2 F F0.05 F0.01 回归 1 353.6628 353.6628 89.89* 5.99 13.74 离回归 6 23.6060 3.9343 总变异 7 377.2688.检验线性回归系数的显著性,采用检验线性回归系数的显著性,采用t t检验法检验法进行。进行。(二)t检验bbsbsbtb b的方差:的方差:iXiiiiii

    21、iySSxxxxyxxxxyyxxb)()()()()(222)()()(iiiieVarexaVaryVarXXiiXiiXiSSSSxxyVarSSxxySSxxVarbVar2222)()()()()(.bbsbsbtxxyxyXebSSsxxsxxnyySSMSs/22/22)()() 2() (df=n-2假 设H H0 0: :=0=0H HA A: :00检验样本回归系数检验样本回归系数b b是否来自是否来自=0=0的双变量总体,的双变量总体,以推断线性回归的显著性。以推断线性回归的显著性。 说明样本回归系数的变异程度不仅取决于误差方差的大小,说明样本回归系数的变异程度不仅取决于

    22、误差方差的大小,也取决于自变量也取决于自变量X X的变异程度。如果自变量的变异程度。如果自变量X X的变异程度大,即的变异程度大,即取值分散一些,则取值分散一些,则b b的变异就会小一些,的变异就会小一些,b b就会稳定一些,回归就会稳定一些,回归方程所估计出的值就会精确一些。方程所估计出的值就会精确一些。.9835. 12/nQsxy1788.55xSS5317. 2b48. 91788.55/9835. 15317. 2/xxybSSsbsbt.48. 9t707. 3)6(01. 0t否定否定H H0 0:=0:=0,接受,接受H HA A:0:0,认为黏虫孵,认为黏虫孵化历期平均温度与

    23、历期天数间有真实直线化历期平均温度与历期天数间有真实直线回归关系。回归关系。.48.9bsbt89.892/1/nQUF同一概率值同一概率值F F(一尾)值(一尾)值(dfdf1 1=1,df=1,df2 2=n-2=n-2)t t值(两尾)(值(两尾)(df=n-2df=n-2)2tF 28704.8989.89tF. 依变量对自变量的回归关系是通过回归系数来体现的,依变量对自变量的回归关系是通过回归系数来体现的,截距的大小对回归关系没有影响。当截距为截距的大小对回归关系没有影响。当截距为0时,表示回归时,表示回归直线通过原点(直线通过原点(0,0)。有时需要检验回归直线是否通过原)。有时需

    24、要检验回归直线是否通过原点,就要对点,就要对 是否为是否为0进行检验,可以利用进行检验,可以利用t 检验,为此需要检验,为此需要先求出先求出 的期望和方差:的期望和方差:(三)对截距的检验aaxxbExyExbyEaE)()()()(1)()()()(222XSSxnbVarxyVarxbyVaraVara122XESSxnMSsaaasasatdf=n-2假 设H H0 0: : =0 =0 H HA A: : 0 0aa.xy5317. 20400.5755.41788.558375.16819343.3122XEaSSxnMSs5363.1255. 404.57asat3.707t0.0

    25、1(6)与与0 0的差异是极显著的,也就是说没有通的差异是极显著的,也就是说没有通过原点。过原点。a. 特别要指出的是:利用直线回归方程进特别要指出的是:利用直线回归方程进行预测或控制时,一般只适用于原来研究行预测或控制时,一般只适用于原来研究的范围,不能随意把范围扩大,因为在研的范围,不能随意把范围扩大,因为在研究的范围内两变量是直线关系,这并不能究的范围内两变量是直线关系,这并不能保证在这研究范围之外仍然是直线关系。保证在这研究范围之外仍然是直线关系。若需要扩大预测和控制范围,则要有充分若需要扩大预测和控制范围,则要有充分的理论依据或进一步的实验依据。利用直的理论依据或进一步的实验依据。利

    26、用直线回归方程进行预测或控制线回归方程进行预测或控制 , 一一 般只能般只能内插,不要轻易外延。内插,不要轻易外延。.第三节:直线相关 Linear Correlation一、相关系数和决定系数一、相关系数和决定系数二、相关系数的假设检验二、相关系数的假设检验三、相关系数的区间估计三、相关系数的区间估计.一、相关系数xy线性关系了解x和y相关以及相关的性质相关系数.相关类型相关类型正相关负相关零相关.IIIIIIIVIIIIIIIVIIIIIIIV),(yx),(yyxx.IIIIIIIV0, 0:yyxxI0, 0:yyxxII0, 0:yyxxIII0, 0:yyxxIV0)(yyxx.I

    27、IIIIIIV0)(yyxx0)(yyxxIIIIIIIV.IIIIIIIV0)(yyxx.)(yyxx直线相关的两个变量的相关程度和性质直线相关的两个变量的相关程度和性质11)(),(nSPnyyxxyxCovxy乘积和乘积和互变量(1)1)单位问题单位问题(2)x2)x与与y y本身的变异会影响本身的变异会影响x x与与y y之间的相关性之间的相关性?这个统计量也称为样本协变量(这个统计量也称为样本协变量(covairance),表示表示Cov (x , y)。.1)(nyyxxyxSSyxCovnyynxxnyyxxr),(1)(1)(1)(22r ryxxySSSSSPyyxxyyxx

    28、r22)()()(r r可以用来比较不同双变量的相关程度和性质。可以用来比较不同双变量的相关程度和性质。.样本总体yxxypyxxySSSSSPyyxxyyxxr22)()()(.22)()()(yyxxyyxxr两个变量在相关系数计算两个变量在相关系数计算中的地位是中的地位是平等平等的,没有的,没有自变量和依变量之分自变量和依变量之分相关相关回归回归区别联系yRyyxyxxySSSSSSbSPSSSPSSSPSSSSSPr.yEyEyyRSSSSSSSSSSSSSSr12102 r11r1r.1r1r0Q用 y 可以准确预测y值x与y完全相关。完全正相关完全负相关散点图上所有点必在一条直线上

    29、。ySSQr12.0rySSQ 回归一点作用也没有,即用x的线性函数完全不能预测y值的变化。1rySSQr12x与y之间不存在直线相关关系,这时散点图分布紊乱,没有直线的趋势,但可能存在非线性关系。IIIIIIIV.10 rx x的线性函数对预测的线性函数对预测y y值的变化有一定作值的变化有一定作用,但不能准确预测,说明用,但不能准确预测,说明y y还受其他还受其他因素(包括随机误差)的影响。因素(包括随机误差)的影响。.相关系数相关系数(r) 和决定系数和决定系数(r2) 的区别的区别(1) (1) 除去除去 r =1r =1和和0 0的情况外,的情况外,r r 2 2 r r,这样可,这

    30、样可以防止对相关系数所表示的相关程度作夸张的解释。以防止对相关系数所表示的相关程度作夸张的解释。(2 2)r r可正可负,可正可负,r r2 2取正,取正, r r2 2一般只用于表示相关程一般只用于表示相关程度而不表示相关性质。度而不表示相关性质。.温度天数9682. 02688.3771788.556937.139yxxySSSSSPr9374. 02r黏虫孵化历期平均温度与历期天数成负相关。黏虫孵化历期平均温度与历期天数成负相关。x x和和y y的变异有的变异有93.7493.74可用二者之间的线性关可用二者之间的线性关系来解释。系来解释。.H H0 0: :=0=0H HA A: :0

    31、0 r是一个统计量,反映线性关系强弱的指标。而由于可能存在抽样误差,并不能直接说明总体线性相关关系是否确实存在。对于相关系数对于相关系数r r作显著性检验的无效假设为作显著性检验的无效假设为=0 =0 ,即测定,即测定r r来自来自=0 =0 总体的概率,也就总体的概率,也就是判断是判断r r所代表的总体是否存在直线相关。所代表的总体是否存在直线相关。总体相关系数=0二、相关系数的假设检验.22222)()1 ()()(yyryyryySSy(一)假设检验:(一)假设检验:检验方法有:检验方法有:F F 检验检验 t t 检验检验 利用相关系数临界值表利用相关系数临界值表1、 F 检验检验 从

    32、两个变量中任选出一个变量,求出它的平方和并将从两个变量中任选出一个变量,求出它的平方和并将其剖分为相关平方和与非相关平方和。如选择变量其剖分为相关平方和与非相关平方和。如选择变量y,其,其平方和及其剖分为:平方和及其剖分为:式中:等式右边的第式中:等式右边的第1项为相关平方和;第项为相关平方和;第2项为非相关项为非相关平方和。平方和。.综上所述,可归纳成方差分析表综上所述,可归纳成方差分析表(analysis of (analysis of variance table)variance table)S S非相关非相关2 2n-2n-2SSSS非相关非相关非相关非相关n-1n-1SSSS总总总

    33、和总和S S相关相关2 21 1SSSS相关相关相关相关F F均方均方自由度自由度平方和平方和变异来源变异来源F FS S相关相关2 2S S非相关非相关2 29374. 02688.3771788.556937.1392yxxySSSSSPr2688.377)(2yySSy3.93.96 623.623.6非相关非相关7 7SSSS总总总和总和353.71 1353.7353.7相关相关F F均方均方自由度自由度平方和平方和变异来源变异来源F F90.790.7F F0.050.05F F0.010.0113.7413.745.995.99.2)1 (2)()1 (1)(222222nrrn

    34、yyryyrFF 值的计算实际上可以不考虑,因为分母和分子都有它,值的计算实际上可以不考虑,因为分母和分子都有它,可以约掉。可以约掉。如果选择如果选择x并对其平方和进行剖分,结果一样的。并对其平方和进行剖分,结果一样的。.()假设(2)水平(3)检验(4)推断H H0 0:=0 :=0 ;H HA A: 0: 0选取显著水平选取显著水平0.010.0148.91021.09682.02)1 (2nrrsrtr否定否定H H0 0,接受,接受H HA A;推断;推断r r极显著,黏虫孵化历期温极显著,黏虫孵化历期温度与历期天数之间存在着极显著的直线相关关系。度与历期天数之间存在着极显著的直线相关

    35、关系。707.3)6(01.0 tt2、 t 检验检验.3 3、利用相关系数临界表检验、利用相关系数临界表检验 相关系数的假设检验可不计算相关系数的假设检验可不计算t t值,直接值,直接从附表从附表1212查出查出dfdf=n-2=n-2时时r r的临界值。的临界值。222nttra 临界值特点:当样本对子数很少时,样临界值特点:当样本对子数很少时,样本相关系数很大时才会显著;而当对子数大本相关系数很大时才会显著;而当对子数大到到100100时,只要达到时,只要达到0.19460.1946就显著。就显著。.r r经显著性检验的结果呈不显著时,经显著性检验的结果呈不显著时,便推断两变数间不存在相

    36、关关系,便推断两变数间不存在相关关系,这时不能用这时不能用r r代表其相关密切程度。代表其相关密切程度。.三、相关系数的区间估计r r值经假设检验达到显著水平,需要值经假设检验达到显著水平,需要由由r r估计总体相关系数估计总体相关系数所在的区间。所在的区间。 y(x1,y1)(x2,y2)(x3,y3)(xn,yn)yxxySSSSSPrX. 0 0两变量无直线相关关系Nr 0 0两变量有直线相关关系tNr,.)11lg(1513. 1)11ln(5 . 0rrrrz)3(1nzzzuzLuzL21)1()1(22LLeer正态分布.0627. 2)9682. 019682. 01ln(5

    37、. 0)11ln(5 . 0rrz4472. 0)38(1)3(1nz1862.19392.221zzuzLuzL9682.0r.8294.0)1()1(9944.0)1()1(2211222221LLLLeeLeeL黏虫孵化历期温度与历期天数的总体相关系数黏虫孵化历期温度与历期天数的总体相关系数的的9595的置信区间为(的置信区间为(-0.9944-0.9944,-0.8294-0.8294)。)。.相关与回归的联系相关与回归的联系回归方程的显著性回归方程的显著性回归系数的显著性回归系数的显著性相关系数的显著性相关系数的显著性一致一致xybxay.rbbxay三者同时显著或不显著。三者同时显

    38、著或不显著。r r与与b b的符号一致,由两变量离均差乘积的符号一致,由两变量离均差乘积之和的符号决定。之和的符号决定。相关与回归的联系相关与回归的联系)2(2/1/nQUnQUFbbsbsbtrrsrsrt.rbbxayr:+,两变量间的相互关系是同向变化的。两变量间的相互关系是同向变化的。b:+,x增(减)一个单位,增(减)一个单位,y平均值增平均值增(减)(减)b个单位。个单位。相关与回归的联系相关与回归的联系.用回归解释相关。ySSUr2相关与回归的联系相关与回归的联系.y关于x的直线回归系数x 关于y的直线回归系数2/)()(xxyyxxbxy2/)()(yyyyxxbyx22/rS

    39、SSSSPbbyxxyyxxyyxSSSSyyxxr)(.回归相关x x是可以精确是可以精确测量和严格测量和严格控制的变量控制的变量。y y服从正态分布。服从正态分布。x x服从正态分布。服从正态分布。y y服从正态分布。服从正态分布。xbayxyxy/ybaxyxyx/I型回归II型回归相关与回归的区别相关与回归的区别资料要求xy.两变量间依存变化的数量关系两变量间依存变化的数量关系两变量间相关关系两变量间相关关系回归相关相关与回归的区别相关与回归的区别应用xy单向xyxy双向.回归系数与相关系数的正负号都由两变量回归系数与相关系数的正负号都由两变量离均差积之和的符号决定,所以同一资料离均差

    40、积之和的符号决定,所以同一资料的的b b与其与其r r的符号相同。的符号相同。回归系数有单位,形式为(应变量单位回归系数有单位,形式为(应变量单位/ /自变量单位),相关系数没有单位。自变量单位),相关系数没有单位。相关系数的范围在相关系数的范围在-1-1+1+1之间,而回归系之间,而回归系数没有这种限制。数没有这种限制。.有些资料用相关表示较适宜,比如兄弟与有些资料用相关表示较适宜,比如兄弟与姐妹间的身长关系、人的身长与前臂长之姐妹间的身长关系、人的身长与前臂长之间的关系等资料。间的关系等资料。有些资料用相关和回归都适宜,此时须视有些资料用相关和回归都适宜,此时须视研究需要而定。研究需要而定

    41、。就一般计算程序来说,是先求出相关系数就一般计算程序来说,是先求出相关系数r r并对其进行假设检验,如果并对其进行假设检验,如果r r显著并有进行显著并有进行回归分析之必要,再建立回归方程。回归分析之必要,再建立回归方程。 .作相关与回归分析要有实际意义。作相关与回归分析要有实际意义。不要把毫无关联的两个事物或现象用来作相关不要把毫无关联的两个事物或现象用来作相关或回归分析。或回归分析。*如儿童身高的增长与小树的增长,作相关分析如儿童身高的增长与小树的增长,作相关分析是没有实际意义的,如果计算由儿童身高推算是没有实际意义的,如果计算由儿童身高推算小树高的回归方程则更无实际意义。也许算得小树高的

    42、回归方程则更无实际意义。也许算得的的r r、b b是显著的,也是没有意义的。是显著的,也是没有意义的。 .相关分析只是以相关系数来描述两个变量间相互相关分析只是以相关系数来描述两个变量间相互关系的密切程度和方向,并不能阐明两事物或现关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质。象间存在联系的本质。对相关分析的作用要正确理解。*相关并不一定就是因果关系,切不可单纯依靠相关相关并不一定就是因果关系,切不可单纯依靠相关系数或回归系数的显著性系数或回归系数的显著性“证明证明”因果关系之存在。因果关系之存在。要证明两事物间的因果关系,必须凭籍专业知识要证明两事物间的因果关系,必须凭籍专业

    43、知识从理论上加以阐明。但是,当事物间的因果关系从理论上加以阐明。但是,当事物间的因果关系未被认识前,相关分析可为理论研究提供线索。未被认识前,相关分析可为理论研究提供线索。.适合相关和回归分析的资料通常有两种一个变量X是选定的,另一个变Y是从正态分布的总体中随机抽取的。*回归分析.由一个变量推算另一个变量由一个变量推算另一个变量说明两变量间的相互关系说明两变量间的相互关系两变量X、Y(或X1、X2)都是从正态分布的总体中随机抽取的,即是正态双变量中的随机样本。回归分析相关分析.在回归分析中,由X推算Y与由Y推算X的回归方程是不同的,不可混淆。 必须正确选定自变量与应变量。必须正确选定自变量与应

    44、变量。一般说,事物的原因作自变量一般说,事物的原因作自变量X X,当事物的,当事物的因果关系不很明确时,选误差较小的即个体因果关系不很明确时,选误差较小的即个体变异小的变量作自变量变异小的变量作自变量X X,以推算应变量,以推算应变量Y Y。.回归方程的适用范围有其限度,一般仅回归方程的适用范围有其限度,一般仅适用于自变量适用于自变量X X的原数据范围内,而不的原数据范围内,而不能任意外推。因为我们并不知道在这些能任意外推。因为我们并不知道在这些观察值的范围之外,两变量间是否也呈观察值的范围之外,两变量间是否也呈同样的直线关系。同样的直线关系。 .一、直线回归方程的建立一、直线回归方程的建立

    45、。 1 2 3 4 5 64321正向直线关系正向直线关系 1 2 3 4 5 64321负向直线关系负向直线关系 1 2 3 4 5 64321曲线关系曲线关系.三、直线回归的区间估计a和b的置信区间(一)y/x 的置信区间和单个的置信区间和单个y y的预测区间的预测区间(二)y/x 和单个和单个y y观测值置信区间图示观测值置信区间图示(三).(一)a和b的置信区间bxayebxay)(xxy.(一)a和b的置信区间xbya)1(22/2xxyaSSxnss)1(2/xxyaSSxnssasatdf = 2总体回归截距总体回归截距的置信区间的置信区间aastaLstaL21.(一)a和b的

    46、置信区间总体回归系数总体回归系数 的置信区间的置信区间bbstbLstbL21xxybSSss/.8375.16nxx9835. 12/nSSsExy1788.55)()(222xxnxxSSx3009. 1)1(2/xxyaSSxnss2670. 0/xxybSSss.707. 3447. 2)6(01. 0)6(05. 0tt2233.608567.5321aastaLstaL8784. 11850. 321bbstbLstbL3009. 1as0400.57a2670. 0bs5317. 2bxy5317. 20400.5795%95%的样本回归截的样本回归截距落在该区间内距落在该区间内

    47、95%95%的样本回归系的样本回归系数落在该区间内数落在该区间内.(二)y/x 的置信区间和单个的置信区间和单个y y的预测区间的预测区间xy/)(xxbybxay不包含随机误差不包含随机误差由回归方程预测由回归方程预测x x为某一定值时为某一定值时y y的观测值所在区间,则的观测值所在区间,则y y观测值不仅受到观测值不仅受到y y和和b b的影响,也受到随机误差的影响。的影响,也受到随机误差的影响。xy5317. 20400.57.bxay)(xxyy y总体的平均数总体的平均数单个单个y y值所在的区间值所在的区间x x点估计点估计(二)y/x 的置信区间和单个的置信区间和单个y y的预

    48、测区间的预测区间.xxyySSxxnss22/2)(1xxyySSxxnss2/)(1yxysyt/df = n-2y y总体的平均数总体的平均数单个单个y y值所在的区间值所在的区间x xy y总体的平均数总体的平均数.yystyLstyL21xy/xxyySSxxnss2/)(1.黏虫孵化历期平均温度为黏虫孵化历期平均温度为1515时,历期时,历期天数为多少天(取天数为多少天(取9595置信概率)?置信概率)?8559.0)(12/xxyySSxxnss0645.1915)5317. 2(0400.57bxay1589.219701.1621yystyLstyL.xxyySSxxnss22

    49、/2)(11xxyySSxxnss2/)(11ysyytdf =n- 2y y总体的平均数总体的平均数x x单个单个y y值所在的区间值所在的区间单个单个y y值所在的区间值所在的区间.yystyLstyL21yxxyySSxxnss2/)(11.某年的历期平均温度为某年的历期平均温度为1515时,该年的历时,该年的历期天数为多少天(取期天数为多少天(取9595置信概率)?置信概率)?1603. 2)(112/xxyySSxxnss0645.1915)5317. 2(0400.57bxay3508.247782.1321yystyLstyL.(二)y/x 的置信区间和单个的置信区间和单个y y

    50、的预测区间的预测区间1603. 2)(112/xxyySSxxnss3508.247782.1321yystyLstyL8559. 0)(12/xxyySSxxnss1589.219701.1621yystyLstyL.(三)y/x 和单个和单个y y观测值置信区间图示观测值置信区间图示0 05 51010151520202525303035359 91212151518182121预测值均值下限均值上限预测值下限预测值上限.xxyySSxxnss2/)(11xxyySSxxnss2/)(1xxxSSn正比反比愈靠近愈靠近 x x ,对,对y y总体平均值或单个总体平均值或单个y y的估计值就

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第七章直线回归相关分析课件.ppt
    链接地址:https://www.163wenku.com/p-2993417.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库