大学课件:第3章双变量模型 假设检验.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大学课件:第3章双变量模型 假设检验.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学课件:第3章双变量模型 假设检验 大学 课件 变量 模型
- 资源描述:
-
1、1 回归分析概述参数估计模型检验模型预测第三章第三章双变量模型:假设检验古典线性回归模型的基本假定 最小二乘估计量的性质 普通最小二乘估计量的方差与标准误参数的普通最小二乘估计iiiXY10i=1,2,n见第二章2第二节 参数估计本章(第3章)基本内容简介 一、参数估计 1.古典线性回归模型假定 2.OLS估计量的方差与标准误 3.OLS估计量的性质 二、统计检验(*)1.参数估计量的置信区间检验 2.变量的显著性检验 3.回归直线的拟合优度检验 三、回归分析结果的报告 四、预测一、古典线性回归模型的基本假定 原因1:只有符合这些基本假定,才能保证OLS参数估计量具有良好的性质;原因3:随机误
2、差项加上一个非随机项X生成了Y,因而Y也是随机变量。在根据SRF进行假设检验时,如果不对随机误差项的生成做一些特殊的假定,则无法进行假设检验,也就更无法进行预测。原因2:如果不满足这些假定,第二部分(即第710章)会进一步进行处理。这是基于学习的由浅入深、由理想状态到现实实际的步骤。4简单地说,首先,对模型作基本假定后,对模型的估计才可能具有良好的统计性质。所估计的参数才能尽可能地接近总体参数的真实值;其次,在最小二乘估计的统计性质的证明中,基本假定是必备条件;第三,因为模型中有随机误差项,所估计的参数也是随机变量,显然,参数估计量的分布与随机误差项的分布有关,只有对随机误差项的分布作出某些假
3、定,才能比较方便地确定参数估计量的分布性质,才可能在此基础上对参数进行假设检验和区间估计进行统计推断,也才可能对被解释变量作区间预测。一、古典线性回归模型的基本假定 假定1:回归模型是参数线性的,但不一定变量是线性的假定2:解释变量X与随机误差项之间不相关。(注:在前面学习时已经给出,X是非随机变量)Cov(Xi,i)=0 i=1,2,n如果X是非随机的(即为固定值),则该假定自动满足。我们所指的回归分析是条件回归分析,即给定X条件下的回归分析,即我们一直假定X是非随机的。6假定3:给定X i,随机误差项的期望或均值为零。E(i X i)=0 i=1,2,n表明:随机误差项(其他影响因素)与X
4、i(纳入模型的变量)之间不相关。7假定4:随机误差项具有同方差,即方差为常数。Var(i)=2 i=1,2,n表明:与给定X相对应的每个Y的条件分布具有同方差,即每个Y值以相同的方差分布在其均值周围。8假定5:无自相关。即随机误差项之间不相关。Cov(i,j)=0 ij i,j=1,2,n表明:误差项之间没有系统关系,即误差项是随机的。9假定6:回归模型是正确设定的。即实证分析的模型不存在设定偏差。假定7:随机误差项服从零均值、同方差、零协方差的正态分布。(补充)iN(0,2)i=1,2,n为了推导估计量的抽样分布,需要增加以下假定可以计算出OLS的估计量及其标准误、估计量的统计性质根据中心极
5、限定理可得,参数估计量也服从正态分布进一步说明10),(2211ixN),(22200iixnXN11小结-古典线性回归模型的基本假定假定1:回归模型是参数线性的假定2:解释变量X与随机误差项之间不相关。假定6:回归模型是正确设定的。即实证分析的模型不存在设定偏差(即模型中包括了所有影响变量)。基本假定基本假定:有两个方面有两个方面:一是对变量和模型假定一是对变量和模型假定;二是对随机误差项的统计分布的假定二是对随机误差项的统计分布的假定.假定3、4、5、7:随机误差项服从零均值、同方差、零协方差的正态分布。iiiXY10i=1,2,n12二、普通最小二乘估计量的方差与标准误基于1-6假定,可
6、以估计OLS估 指标计量的方差和标准误。结论:该度量指标回答了参数估计量如何随着样本的变化而变化。OLS估计量是随机变量,因为随着样本的不同,OLS估计量是不同的。OLS估计量是如何随样本变化而变化的呢,即这些估计量的抽样变异性是怎样的呢?这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。13XYxyxiii1021参数估计量的方差和标准误14二、普通最小二乘估计量的方差与标准误)var()var()var()var(21021iiiiiiikXkYk22222iiixxx221020)/1()var()var()var(iiiiiikXnXwYw2222222221121ii
7、iiixxXkXnnkXkXnn22222222221iiiiixnXxnXnxxXn15随机误差项的方差2的估计 由于随机项 i不可观测,只能从 i的估计残差ei i出发,对总体方差进行估计。二、普通最小二乘估计量的方差与标准误2又称为总体方差总体方差。16 可以证明可以证明,2的最小二乘估计量最小二乘估计量为222nei二、普通最小二乘估计量的方差与标准误随机误差项的方差2的估计 是2 的估计量 是残差平方和,即Y的真实值与估计值之差的平方和(n-2)称为自由度,可简单看做观测值个数减去待估参数的个数222ie称为回归的标准误(SER,standard error of the regre
8、ssion)该值越小,说明Y的实际值越接近根据回归模型得到的估计值。17在 随 机 误 差 项 的 方 差 2估 计 出 后,参 数0和1的 方方 差差 和 标标 准准 差差 的 估 计 量 分 别 是:1的样本方差:2221ixS 1的样本标准差:21ixS 0的样本方差:22220iixnXS 0的样本标准差:220iixnXS 标准误标准误方差方差二、普通最小二乘估计量的方差与标准误18二、普通最小二乘估计量的方差与标准误19 432.4138+0.0013XiSe=(16.9061)(0.000245)二、普通最小二乘估计量的方差与标准误数学S.A.T一例文章中回归结果的输出形式更进一
9、步的含义后面再解释参数估计值标准误20 当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。一个用于考察总体的估计量,可从如下几个方面考察其优劣性:(1)线性性)线性性,即参数估计量是否是另一随机变量Y的线性函数;(2)无偏性)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性)有效性,即它是否在所有线性无偏估计量中具有最小方差。三、最小二乘估计量的性质-为什么使用OLS 21三、最小二乘估计量的性质-为什么使用OLS 高斯高斯马尔柯夫定理(马尔柯夫定理(Gauss-Markov theorem)如果满足古典线性回归模型的基本假定
10、,则在所有线性估计量中,OLS估计是最优线性无偏估计量(Best Linear Unbiased Estimator,BLUE)简单易行很强的理论性质22232 2、无无偏偏性性,即估计量0、1的均值(期望)等于总体回归参数真值0与1 1111)()()(iiiiEkkEE0000)()()()(iiiiEwEwEE平均而言,参数估计值与其真值是一致的。22E平均而言,误差方差的估计值收敛于其真值;误差方差的估计量也是无偏的24证明最小方差性假设*1是其他估计方法得到的关于1的线性无偏估计量:iiYc*1其中,ci=ki+di,di为不全为零的常数则容易证明)var()var(1*1同理,可证
11、明0的最小二乘估计量0具有最的小方差 3 3、有有效效性性(最最小小方方差差性性),即在所有线性无偏估计量中,最小二乘估计量0、1具有最小方差。25第二节 参数估计-小结古典线性回归模型的基本假设 最小二乘估计量的性质 普通最小二乘估计量的方差与标准误参数的普通最小二乘估计iiiXY10i=1,2,n26结构参数结构参数分布参数分布参数第三节 统计检验回归分析回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。尽管从统计性质统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。那
12、么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验统计检验。27第三节 统计检验28假设检验三、拟合优度检验 一、参数的置信区间法 二、变量的显著性检验法 四、回归分析结果的报告 五、正态性检验 检验样本回归函数与总体回归函数的“接近”程度即样本回归函数能否代表总体回归函数进行统计推断检验样本回归函数与样本点的“拟合优度”检验解释变量X对被解释变量 Y是否存在着显著的线性影响(掌握)检验样本回归函数与总体回归函数的“接近”程度(了解)29假设检验 所谓假设检验,就是 事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信
13、息与原假设是否有显著差异,从而决定是否接受或否定原假设。先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。30假设检验数学S.A.T一例现假定家庭年收入(X)对学生的数学分数(Y)没有影响希望确认Y是否与X有关H0:1=0如果零假设为真,就没有必要把X纳入模型了虽然本例中的参数估计值不为零,但是由于抽样的波动性,数值结果会因为样本的变化而不同。显然,需要正规的检验过程拒绝或接受零假设。如何进行呢?432.41380.0013iiYX31假设检验数学S.A.T一例置信区间法可选择两种方法对0和 1的参数进行检验显著性检验法由于 服从正态分布,则变量Z服
14、从标准正态分布),(2211ixN),(22200iixnXN1111112-=0 1/iZNSx,由于 未知,需用 代替,因此上式服从t分布1122-/nitx32一、置信区间法 数学S.A.T一例设定自由度为d.f;假定显著性水平为 ,可得/2/2.1Ptd fttd f 111112-/itSx1111/2/2/2/21/211/2-.1Ptd fttd fPtd ftd fSPtd fStd fS 因为 H0:1=0,H1:10Step1:Step2:/2.td fStep3:Step4:如果原假设的 值落在该区间中,则接受原假设,否则,拒绝原假设。133接受区域拒绝区域拒绝区域1如果
15、接受区域包含零假设值 ,则不拒绝零假设。当然,无论做何种决定,都会以一定的概率(如 )犯错。1111/211/2.1Ptd fStd fS 11/2.td fS11/2.td fS置信区间置信区间显著性水平显著性水平端点称为置信限置信限(confidence limit)或临界值临界值(critical values)(confidence coefficient)(confidence interval)(level of significance)置信系数置信系数(置信度)置信度)置信区间置信区间临界值临界值临界值临界值34一、置信区间法 数学S.A.T一例本例中,自由度为8(10-2)假
展开阅读全文