大学课件:第4章 多元回归:估计与假设检验(新) (2).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学课件:第4章 多元回归:估计与假设检验(新) (2).ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学课件:第4章 多元回归:估计与假设检验新 2 大学 课件 多元 回归 估计 假设检验
- 资源描述:
-
1、第3章 双变量模型:假设检验复习重点复习重点:1 1、参数估计掌握的基本知识:、参数估计掌握的基本知识:六个基本假定是满足最小二乘估计量三个性质的基本条件;六个基本假定是满足最小二乘估计量三个性质的基本条件;自变量前的参数估计量称为结构参数,其对应的标准误称为分布参数;自变量前的参数估计量称为结构参数,其对应的标准误称为分布参数;参数估计值、参数的估计标准误、参数估计值、参数的估计标准误、t t统计量三者之间的数量关系统计量三者之间的数量关系2 2、统计检验:、统计检验:判定系数检验:判定系数检验:度量了解释变量对被解释变量变异的解释比例。度量了解释变量对被解释变量变异的解释比例。变量显著性检
2、验:变量显著性检验:双边检验双边检验拒绝零假设,表明自变量与因变量之间的线性关拒绝零假设,表明自变量与因变量之间的线性关系显著;单边检验系显著;单边检验拒绝零假设,表明自变量对因变量有正向(或负向)影响。拒绝零假设,表明自变量对因变量有正向(或负向)影响。3 3、回归分析报告:估计方程、回归分析报告:估计方程、t t统计量、估计标准误、判定系数、统计量、估计标准误、判定系数、F F统计量、统计量、D.W.D.W.统计量统计量1第第4章章 多元回归:估计与假设检验多元回归:估计与假设检验本章讲授内容本章讲授内容:前三个内容类似于双变量模型(了解);前三个内容类似于双变量模型(了解);后两个内容有
3、所不同后两个内容有所不同4.14.1多元线性回归模型多元线性回归模型 4.24.2多元线性回归模型的若干假定多元线性回归模型的若干假定4.34.3多元线性回归模型的参数估计多元线性回归模型的参数估计 4.44.4多元线性回归模型的统计检验多元线性回归模型的统计检验(*)(判定系数(判定系数P77P77、变量显著性、模型整体检验变量显著性、模型整体检验)4.54.5对模型设定的讨论(增减解释变量)对模型设定的讨论(增减解释变量)(*)P83P832 4.1多元线性回归模型-一般表现形式一般表现形式多元线性回归模型多元线性回归模型:线性回归模型中的解释变量有多个。ikikiiiXXXY 22110
4、i=1,2,n习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。j也被称为偏回归系数偏回归系数,表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化量;3ikikiiiXXXY 22110kikiikiiiiXXXXXXYE 2211021),|(总体回归模型(总体回归函数的随机表达形式)总体回归函数(非随机表达式)(1)多元线性回归模型-一般表现形式一般表现形式样本回归模型(样本回归函数的随机表达形式)ikikiiiieXXXY22110样本回归函数(非随机表达式)kikiiiiXXXY2211044.2多元线性回归模型的基本假定(类似于双变量模
5、型假设)假设1:回归模型是参数线性的,并且正确设定。0)(iE22)()(iiEVar0)(),(jijiECovnjiji,2,1,假设2:解释变量与随机项不相关。0),(ijiXCov假设7:随机项满足正态分布。),0(2Nikj,2,1 假设3、4、5:随机误差项具有零均值、同方差及不序列相关性。假设6:解释变量之间不存在完全共线性。即解释变量之间没有严格的线性关系。5假设6:解释变量之间不存在完全共线性。即解释变量之间没有严格的线性关系。012322330122133iiiiiiiiiYXXXXXX例:收入储蓄消费123XXX0112233iiiiiYXXX64.3 多元线性回归模型的
6、参数估计 一、普通最小二乘估计(计算机实现)二、参数估计量的方差和标准误(计算机实现,用于变量显著性检验)三、参数估计量的性质(同双变量)7根据最小二乘原理,求参数估计值0000210QQQQk其中2112)(niiiniiYYeQ2122110)(nikikiiiXXXYikikiiiXXXY 22110(1)普通最小二乘估计结构参数;分布参数8于是得到关于待估参数估计值的正规方程组正规方程组:kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110 解该(k+1)个方程组成
7、的线性代数方程组,即可得到(k+1)个待估参数的估计值,jjk 012。KikiiiiXXXY22110i=1,2nYXXX1)(9例:例:在的家庭收入家庭收入-学生数学分数学生数学分数例中,53650000215002150010111111)(22121iiinnXXXnXXXXXXXX39468400156741112121iiinnYXYYYYXXXYX可求得 0735.10003.00003.07226.0)(1EXX于是 7770.0172.10339648400156740735.10003.00003.07226.021E10(2)OLS估计量的方差和标准误随机误差项的方差的估
8、计 可以证明,随机误差项的方差的无偏估计量为 1122knkneiee114.4 多元线性回归模型的统计检验(主要介绍内容)一、拟合优度检验:多元判定系数R2 二、变量的显著性检验:t检验 三、方程的显著性检验:F检验 四、参数的置信区间:参数估计准确度 F检验与T检验的区别F与R2的关系F检验怎么做12 (1)(1)拟合优度检验拟合优度检验TSSRSSTSSESSR1213多元判定系数含义多元判定系数含义:度量度量K K个解释变量对因变个解释变量对因变量量Y Y变动的联合解释比例。变动的联合解释比例。ikikiiiXXXY 22110 (2)(4.7)变量的显著性检验(t检验)注意:k为模型
9、中自变量个数,k+1为估计参数个数)1(1kntkncStiiiiiiiee1122knkneiee1、设计原假设与备择假设:H0:i=0H1:i0(i=1,2k)3、给定显著性水平,可得到临界值t/2(n-k-1)2、由样本求出统计量t的数值4、通过比较 拒绝或接受H0 判定对应的解释变量是否应包括在模型中|t|t/2(n-k-1)或|t|t/2(n-k-1)|P|/2 14 三、方程的显著性检验三、方程的显著性检验(F检验检验)15 方程的显著性检验方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上在总体上是否显著成立作出推断。1、方程的显著性检验(方程的显著性检验(
10、F检验)与变量的显著性检验)与变量的显著性检验(检验(T检验)的区别。检验)的区别。变量的显著性检验,变量的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系,在单个解释变量在单个解释变量是否与被解释变量线性关系显著成立作出推断。F F检验的思想检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS由于回归平方和2iyESS是解释变量X的联合体对被解释变量 Y 的线性作用的结果,考虑比值 22/iieyRSSESS 如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。162、方差分析
11、技术 17对TSS各组成部分进行分析变异来源变异来源平方和平方和自由度自由度MSS=SS/d.f.ESS解释变量个解释变量个数数k(或(或k-1)ESS/kRSSn-待估参数待估参数个数个数(k+1)(或或n-k)RSS/(n-k-1)TSSn-12YY2YY2YY3、(4.8)(4.8)方程显著性的方程显著性的F F检验检验 step1、可提出如下原假设与备择假设:H0:1=2=k=0;H1:j不全为0)1/(/knRSSkESSFstep3、给定显著水平给定显著水平,可得到临界值,可得到临界值F(k,n-k-1)step2、由样本求出统计量F的数值 step4、通过比较 拒绝或接受原假设H
12、0 判定原方程总体总体上上的线性关系是否显著成立(注意注意:k:k为模型中解释变量的个数为模型中解释变量的个数)F F(k,n-k-1)拒绝原假设;FF(k,n-k-1)接受原假设根据数理统计学中的知识根据数理统计学中的知识,在原假设,在原假设H0成立的条件成立的条件下,该统计量服从自由度下,该统计量服从自由度为为(k,n-k-1)的的F分布分布 184、关于F与R2的关系2ESSESSRTSSESSRSS22/11/1ESS kRkFRSS nkRnk211ESSRSSRSSRESSESS 说明这两个统计量同方向变动说明这两个统计量同方向变动。R2=0时,时,F=0;R2值越大,值越大,F值
13、越大;值越大;R2=1时,时,F趋于趋于R219 四、参数的置信区间(了解)参数的置信区间用来考察:在一次抽样中所估计的参数值离参参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多数的真实值有多“近近”。即即参数估计值的估计准确程度参数估计值的估计准确程度)1(1kntkncStiiiiiiiee在(1-)的置信水平下i的置信区间是(,)iitstsii22其中,t/2为显著性水平为、自由度为n-k-1的临界值。20思考题思考题 t=(5.858)(-0.668)(-0.494)模型1 R2=0.9960 d=3.1568 F=15.6 n=10 t=(7.464)(-2.4
14、69)(2.619)模型2 R2=0.9980 d=3.5241 F=17.6 n=10要求要求(1)解释两个模型判定系数的含义;()解释两个模型判定系数的含义;(2)对两个模型的变量)对两个模型的变量进行显著性检验,并指出哪个模型更优;(进行显著性检验,并指出哪个模型更优;(3)对两个模型进行显)对两个模型进行显著性检验(著性检验(F检验);(检验);(4)解释模型)解释模型2中偏回归系数的含义。(显中偏回归系数的含义。(显著性水平著性水平=0.05)注:模型中注:模型中,Y-服装消费;服装消费;X1-可支配收入;可支配收入;X2-流动资流动资产产;X3-服装价格;服装价格;X4-相关商品价
15、格相关商品价格XXXY3210345.00379.01387.09400.0XXXY4313186.01882.01036.07593.12对模型1各问题回答(1)解释模型判定系数的含义;)解释模型判定系数的含义;答答:0.996表明三个解释变量表明三个解释变量(即可支配收入、流动资产、服装价格)即可支配收入、流动资产、服装价格)对被解释变量(即服装消费)变动的联合解释比例为对被解释变量(即服装消费)变动的联合解释比例为99.6%。(2)对模型)对模型1的变量进行显著性检验;的变量进行显著性检验;答答:首先首先,根据给出的显著水平根据给出的显著水平0.05,自由度自由度 n-k-1=10-3-
展开阅读全文