《统计计算及统计软件》课件ch7.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《统计计算及统计软件》课件ch7.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计计算及统计软件 统计 计算 软件 课件 ch7
- 资源描述:
-
1、第七章第七章 回归分析回归分析1 相关分析相关分析2 回归模型介绍回归模型介绍3 线性回归最小二乘估计线性回归最小二乘估计4 模型检验与区间估计模型检验与区间估计5 自变量选择自变量选择6 非线性回归非线性回归方法篇:回归分析(第七章)数据:数据:采集某校采集某校841名本科生的高数,概率,线代三门名本科生的高数,概率,线代三门公共基础课的期末卷面成绩,见数据集公共基础课的期末卷面成绩,见数据集.xlsx。问题:问题:1.分析三门课程成绩之间的关系分析三门课程成绩之间的关系 2.通常高数先修于概率,问能否通过高数成绩估通常高数先修于概率,问能否通过高数成绩估计概率成绩?计概率成绩?方法篇:回归
2、分析(第七章)方法篇:回归分析(第七章)样本相关系数Gs,gl=0.7092Gs,xd=0.6852Xd,gl=0.6464而且都通过显著相关的假设检验!7.1 相关分析相关分析由于随机因素的影响,导致变量之间呈现不确定的趋由于随机因素的影响,导致变量之间呈现不确定的趋势性的相互依存和相互依赖的关系,称为势性的相互依存和相互依赖的关系,称为相关关系相关关系。包括:包括:线性相关线性相关和非线性相关;单相关,复相关,偏和非线性相关;单相关,复相关,偏相关。相关。相关分析就是用来研究变量之间的相关关系的方法。相关分析就是用来研究变量之间的相关关系的方法。其中常用的分析工具有:相关系数、散点图、检验
3、等。其中常用的分析工具有:相关系数、散点图、检验等。方法篇:回归分析(第七章)7.1 相关分析相关分析 二维随机变量二维随机变量(X,Y)而言,若方差存在,则相关系数为而言,若方差存在,则相关系数为其样本其样本 ,可定义样本相关系数为可定义样本相关系数为方法篇:回归分析(第七章)cov(,)()()()()()()XYX YEXE XYE YD X D YD X D Y12211()()()()niiiXYnniiiixxyyrxxyy,1,2,iix yin|1|=10,()1 XYXYaP YaXb0,0=0|1负相关正相关不相关,|完全相关作为的估计XYXYXYXYXYXYr7.1 相关
4、分析相关分析 方法篇:回归分析(第七章)1.包:MASSmvrnorm函数引入二元正态分布的随机数2.x=rnorm(n);y=x+rnorm(n,0,0.6);plot(x,y);cor(x,y)理论上相关系数=?7.1 相关分析相关分析 方法篇:回归分析(第七章)222:0(2)12(|)1检验统计量:检验 值XYoXYXYXYXYrnHTt nrrnpP Tr参考 式子(7.5.8)若p值较小,则拒绝原假设,认为相关性较强,否则认为不相关。例如:x=rnorm(30);y=x+rnorm(30,0,0.6);cor.test(x,y)t=13.538,df=28,p-value=8.23
5、3e-14alternative hypothesis:true correlation is not equal to 095 percent confidence interval:0.8595227 0.96713137.2 回归模型回归模型英国著名生物统计学家高尔顿和他的学生皮尔逊收集英国著名生物统计学家高尔顿和他的学生皮尔逊收集了了1078个家庭的父子代身高数据,发现了人类身高有往个家庭的父子代身高数据,发现了人类身高有往中间靠拢的趋势,把这种趋势称为中间靠拢的趋势,把这种趋势称为回归效应回归效应。并建立了。并建立了一种直线方程:一种直线方程:父代身高以父代身高以177cm作为分割线
6、:低于的向上;高于的向下作为分割线:低于的向上;高于的向下方法篇:回归分析(第七章)33.730.516()85.670.516()英寸=2.54cm厘米yxyx7.2 回归模型回归模型方法篇:回归分析(第七章)2()(|)()()0,()yf xE y xf xED因变量自变量随机误差回归函数参数回归 如f(x)为含参数线性,非线性(一元,多元)半参数回归 部分参数、部分非参数非参数回归 f(x)为非参数形式(无具体函数形式)7.2 回归模型回归模型方法篇:回归分析(第七章)2()()0,()yf xED经典参数回归 p元线性回归模型(p=1)01 100(;)(1)pppiiif xxxx
7、x2(;)()0,()yf xED7.3 线性回归模型的最小二乘估计线性回归模型的最小二乘估计方法篇:回归分析(第七章)01 1002,(1)()0,()pppiiiyxxxxED011111212122111,1ppnnppnnxxyxxyyXxxy2()0,()nyXEDI设计矩阵N阶单位阵7.3 线性回归模型的最小二乘估计线性回归模型的最小二乘估计方法篇:回归分析(第七章)22(0,)()0,()nnyXNIyXEDI1()()()()0()()(),()()令求解利用易得TTTTTTTTQyXyXQx AAxx AxAAAAxxxxX XX y7.3 线性回归模型的最小二乘估计线性回归
8、模型的最小二乘估计方法篇:回归分析(第七章)()=0()()()()()()()()()()()2()()正规方程:TTTTTTTTTTTTX XX yXyXXQyXyXyXXyXXyXyXX XXyX=0=显然只有上式成立,才能保证目标函数最小。7.3 线性回归模型的最小二乘估计线性回归模型的最小二乘估计方法篇:回归分析(第七章)称为 的最小二乘估计,而称为拟合向量,其中yX0111121(,)()()()()称为给定时的拟合值称为帽子矩阵称为残差值,而=称为残差向量称为残差平方和iipipiipTTiiinnTTEiiyxxxxxHX X XXyyyyIH ySyyyy7.3 线性回归模型
9、的最小二乘估计线性回归模型的最小二乘估计方法篇:回归分析(第七章)1当时,称为一元回归p01iiyx011221222222()();(),=(),(),()()iiixyEyyxyyyxxyyixxixyiiiiiixxyyyxxxLSLLLLLyyLxxLxxyyynyxnxx ynx y7.3 线性回归模型的最小二乘估计线性回归模型的最小二乘估计方法篇:回归分析(第七章)2212211122(0,)1.y(),()().,()(),()()2.()13.(,),()4.(1)性质:在前提下是 的线性函数,注意与独立,且TTETjjjjppEENEDX Xr v XE AXAE XD AX
10、AD X ASEnpNCX XCSSnp7.4 模型检验与区间估计模型检验与区间估计方法篇:回归分析(第七章)平方和分解2222=()()()()TiiiiiiiSyyyyyyyyyy()讨论它们的关系ERSS22221/(1)11(1)11/(1)称为决定系数,回归平方和与总离差平方和的比R 称复负相关系数,越大说明“拟合效果”越好!称为调整决定系数RETTEaTSSRSSRSnpnRRnpSn7.4 模型检验与区间估计模型检验与区间估计方法篇:回归分析(第七章)01222:=0(0,),(,)不适合线性回归模型,即=在正态性前提下,pnnHNIyN XI2222(),(1),独立RESSp
11、np/(,1)/1RESpFF p npSnp显然F很大的时候,拒绝原假设,即认为线性回归模型显著。7.4 模型检验与区间估计模型检验与区间估计方法篇:回归分析(第七章)0220:(,),1T(1)T(1)=0,i=1,2,在正态性前提下,=则有成立时,iEiiiiiiiiiiiiiHpSNCnpt npHt npCC具体例题和程序参考:P2422437.4 模型检验与区间估计模型检验与区间估计方法篇:回归分析(第七章)dat=data.frame(x1=c(8,10,6,11,8,7,10,9,9,6,12,9),x2=c(135.0,150.0,124.5,157.6,129.6,126.
展开阅读全文