区间估计与假设检验课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《区间估计与假设检验课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 区间 估计 假设检验 课件
- 资源描述:
-
1、 区间估计与假设检验 经典正太线性回归模型经典正太线性回归模型 统计学预备知识统计学预备知识 区间估计基本概念区间估计基本概念回归系数回归系数1和和2的置信区间的置信区间2的置信区间的置信区间一、经典正太线性回归模型一、经典正太线性回归模型所谓所谓统计推断的经典理论统计推断的经典理论由两个分支构成,即由两个分支构成,即估计估计和和假设检假设检验验。前面讨论了双变量线性回归模型的参数估计问题。用前面讨论了双变量线性回归模型的参数估计问题。用OLS方方法,估计参数法,估计参数1,2,2。在经典线性回归模型的假定下,。在经典线性回归模型的假定下,可以证明可以证明 、和和 这些参数的估计量满足线性性、
2、无偏这些参数的估计量满足线性性、无偏性和最小方差(性和最小方差(BLUE)。)。估计量的值随样本变化而变化,因此,这些估计量都是随机估计量的值随样本变化而变化,因此,这些估计量都是随机变量。变量。估计是成功的一半。假设检验是另一半。估计是成功的一半。假设检验是另一半。回归分析的目的,不仅仅是估计样本回归函数,而是要用估回归分析的目的,不仅仅是估计样本回归函数,而是要用估计来对总体回归函数进行推断。我们想知道,计来对总体回归函数进行推断。我们想知道,和和 与真与真实的实的 和和 有多接近。有多接近。由于由于 、和和 是随机变量,所以我们需要清楚它们的概是随机变量,所以我们需要清楚它们的概率分布,
3、若不知其概率分布,那我们就无法将它们与其真实率分布,若不知其概率分布,那我们就无法将它们与其真实值相联系。值相联系。1.1.干扰项干扰项u ui i 的概率分布的概率分布为得到为得到OLSOLS的概率分布,我们将专门考虑的概率分布,我们将专门考虑 :(4.1.14.1.1)其中其中假定假定X X 为固定或非随机的,则条件回归分析就以为固定或非随机的,则条件回归分析就以X Xi i 的固定值为条的固定值为条件。件。方程(方程(4.1.14.1.1)表明,)表明,是是Y Yi i 的一个线性函数,的一个线性函数,Y Y i i根据假定根据假定是随机的。由于是随机的。由于则则由于由于k ki i ,
4、系数和系数和Xi i 都是固定的,所以都是固定的,所以 最终是最终是ui i 的一个线性的一个线性函数。函数。假定假定ui 为随机变量,则为随机变量,则 的概率分布将取决于对的概率分布将取决于对ui 的概率的概率分布所做的假定。分布所做的假定。在上一章,我们把普通最小二乘法应用于经典线性回归模型在上一章,我们把普通最小二乘法应用于经典线性回归模型时,并没有对干扰项时,并没有对干扰项ui 的概率分布做出假定。的概率分布做出假定。对这些对这些ui 所做的假定仅是所做的假定仅是:(:(1)它们它们 的期望值为零,(的期望值为零,(2)它们是不相关的,(它们是不相关的,(3)它们有一个不变的方差。有了
5、这些)它们有一个不变的方差。有了这些假定,假定,OLS中估计量满足诸如无偏性和最小方差的统计性质。中估计量满足诸如无偏性和最小方差的统计性质。但是,我们的兴趣不仅要得到但是,我们的兴趣不仅要得到 ,还要利用它对真值,还要利用它对真值 做出推断。或者说,我们的目的不仅是要得到样本回归函数,做出推断。或者说,我们的目的不仅是要得到样本回归函数,还要用它来推测总体回归函数。还要用它来推测总体回归函数。尽管有了高斯尽管有了高斯-马尔可夫定理,但由于马尔可夫定理,但由于OLS法不对法不对ui的概的概率性质做任何假定,仍难以从率性质做任何假定,仍难以从SRF去推断去推断PRF。对这一不足,在回归分析中,人
6、们常常假定对这一不足,在回归分析中,人们常常假定ui遵从正态分遵从正态分布。在第布。在第4章中讨论的经典线性回归模型的假定中增加章中讨论的经典线性回归模型的假定中增加ui 的正的正态性假定,就得到了所谓的态性假定,就得到了所谓的 经典正态线性回归模型经典正态线性回归模型(classical normal linear regression model,CNLRM)2.2.关于关于u ui i 的正态性假定的正态性假定经典正太线性回归假定每个经典正太线性回归假定每个ui 都是都是正态分布正态分布的,并且:的,并且:均值:均值:方差:方差:协方差:协方差:这些假定可更简洁的表述为:这些假定可更简洁
7、的表述为:其中其中 代表代表“其分布为其分布为”,N代表代表“正态分布正态分布”,括号中的,括号中的两项代表正态分布的两个参数:均值和方差。两项代表正态分布的两个参数:均值和方差。性质:对两个正态分布变量来说,零协方差或零相关就意性质:对两个正态分布变量来说,零协方差或零相关就意味着两个变量互相独立。味着两个变量互相独立。因此,在正态性假定下,因此,在正态性假定下,ui 和和uj 协方差为零不仅意味着它协方差为零不仅意味着它们不相关,而且它们是独立分布的。可写成:们不相关,而且它们是独立分布的。可写成:NID表示正态且独立分布(表示正态且独立分布(normally and independen
8、tly distributed)。)。为什么是正态假定?1.ui 代表回归模型中未明显引进的许多自变量(对因变量)代表回归模型中未明显引进的许多自变量(对因变量)的总影响。我们希望这些影响是微小的而且是随机的。利的总影响。我们希望这些影响是微小的而且是随机的。利用统计学中著名的用统计学中著名的中心极限定理(中心极限定理(central limit theorem),),就能证明,如果存在大量独立且相同分布的随机变量,那就能证明,如果存在大量独立且相同分布的随机变量,那么随着这些变量的个数无限增大,它们的总和将趋向正态么随着这些变量的个数无限增大,它们的总和将趋向正态分布。分布。回顾中心极限定理
9、。回顾中心极限定理。令令 为为n个独立的、有均值个独立的、有均值=,方差,方差=的相同的相同PDF的随机变量。令的随机变量。令 (样本均值),那么(样本均值),那么2.正态分布的一个性质是,正态分布变量的任何线性函正态分布的一个性质是,正态分布变量的任何线性函数都是正态分布的。数都是正态分布的。OLS估计量估计量 和和 是是ui 的线性的线性函数,因此,若函数,因此,若ui 是正态分布的,则是正态分布的,则 和和 也是正也是正态分布的。态分布的。3.正态分布是一个比较简单、仅有两个参数的分布,为正态分布是一个比较简单、仅有两个参数的分布,为人们所熟知。人们所熟知。4.如果处理小样本或有限容量样
10、本时,比如说数据少于如果处理小样本或有限容量样本时,比如说数据少于100次观测,那么正态假定就起到关键作用。它不仅有助次观测,那么正态假定就起到关键作用。它不仅有助于推导出于推导出OLS估计量精确的概率分布,而且使我们能用估计量精确的概率分布,而且使我们能用t、F和卡方来对回归模型进行检验。和卡方来对回归模型进行检验。3.3.在正态性假定下在正态性假定下OLSOLS估计量的性质估计量的性质1.它们是无偏的。它们是无偏的。2.它们有最小方差。连同性质它们有最小方差。连同性质1,就意味着它们是最小方差无偏,就意味着它们是最小方差无偏的或者说它们是的或者说它们是有效估计量有效估计量(efficien
11、t estimators)。3.一致性。就是说,随着样本含量无限增大,估计量将收敛到一致性。就是说,随着样本含量无限增大,估计量将收敛到它们的真值。它们的真值。4.(ui 的线性函数)是正态分布的。的线性函数)是正态分布的。均值:均值:方差:方差:方差:方差:或者写成:或者写成:定义标准正态化变量:定义标准正态化变量:Z服从标准正态分布,写作:服从标准正态分布,写作:5.(ui 的线性函数)是正态分布的。的线性函数)是正态分布的。均值:均值:方差:方差:写成写成 令令 同样的,同样的,Z服从标准正态分布。服从标准正态分布。6.服从服从n-2个自由度的个自由度的 分布。分布。7.的分布独立于的分
12、布独立于 。8.,二、统计学预备知识二、统计学预备知识1.统计推断点估计参数估计的一种形式。目的是依据样本参数估计的一种形式。目的是依据样本X=(X1,X2,Xn)估估计总体分布所含的未知参数计总体分布所含的未知参数或或的函数的函数 f()。一般。一般或或f()是总体的某个特征值是总体的某个特征值,如数学期望、方差、相关系数等。如数学期望、方差、相关系数等。比如令,比如令,那么那么 就是真均值就是真均值 的一个估计量。比如的一个估计量。比如 。由于估计量由于估计量 仅提供仅提供 的单一一点估计值,故称点估的单一一点估计值,故称点估计量(计量(point estimator)。)。1231(.)
13、XXXXnX50X 区间估计通过从总体中抽取的样本,根据一定的正确度与精确度的要通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数求,构造出适当的区间,以作为总体的分布参数(或参数的函或参数的函数数)的真值所在范围的估计。的真值所在范围的估计。与点估计相对照,在区间估计中,我们提供真与点估计相对照,在区间估计中,我们提供真将落入其间的将落入其间的一个可能值域。一个可能值域。例如,如果变量例如,如果变量X是正态分布的,则样本均值是正态分布的,则样本均值 也是正态分也是正态分布的,且其均值布的,且其均值=,方差,方差=2/n。即估计量。即估计量 的抽样或
14、概率的抽样或概率分布是分布是 。因此我们可以构造区间:。因此我们可以构造区间:并这样的区间约有并这样的区间约有95%的概率包含真的概率包含真,那么我们正在构造着,那么我们正在构造着的一个的一个区间估计区间估计。注意上面所给的区间依据于一个样本变到。注意上面所给的区间依据于一个样本变到另一个样本的另一个样本的 ,所以是随机的。,所以是随机的。XXX例如,例如,=0.05,则,则1-=0.95,意味着如果我们构造一个置信系数,意味着如果我们构造一个置信系数为为0.95的置信区间,所构区间有的置信区间,所构区间有95%的概率含有真的概率含有真时。一般的,时。一般的,如果置信系数是如果置信系数是1-,
15、我们常说有一个,我们常说有一个100(1-)%置信区间,置信区间,就是显著性水平就是显著性水平(level of significance)。构造两个估计量构造两个估计量 和和 ,两者都是样本,两者都是样本X值的函数,使得值的函数,使得即我们可以说从即我们可以说从 到到 的区间里含有真的区间里含有真的概率是的概率是1-。此。此区间被称为区间被称为的置信度为的置信度为1-的的置信区间置信区间(confidence interval),而而1-成为成为置信系数置信系数(confidence coeffiect)。例假定总体中男子身高是正态分布的,其均值假定总体中男子身高是正态分布的,其均值=英寸且
16、英寸且=2.5英寸。从总体中取一个英寸。从总体中取一个100人的随机样本,其平均身高为人的随机样本,其平均身高为67英寸,求总体平均身高(英寸,求总体平均身高(=)的一个)的一个95%的置信区间。的置信区间。解:由于解:由于 在本咧中在本咧中 ,查表可见:,查表可见:将给定的将给定的 ,和和n值代入,就得到这个值代入,就得到这个95%的置信区间的置信区间为:为:X2.假设检验假定随机变量假定随机变量X有一已知的概率密度函数有一已知的概率密度函数f(x;),其中,其中是分布的是分布的参数,在取得一个大小为参数,在取得一个大小为n的样本之后,我们得到点估计量的样本之后,我们得到点估计量 ,由于真由
17、于真鲜为人知,提问:这个估计量鲜为人知,提问:这个估计量 是否与某个假设的是否与某个假设的值值相符?相符?比方说,比方说,是一个特定的(假定的)是一个特定的(假定的)数值。数值。称虚拟假设(称虚拟假设(null hypothesis),通常记为),通常记为 。与虚拟假设相对的是对立假设(与虚拟假设相对的是对立假设(alternative hypothesis),通),通常记为常记为 ,可叙述为:,可叙述为:。一个假设被称为一个假设被称为简单的简单的,如果它确定了分布的各参数的各一,如果它确定了分布的各参数的各一个值;否则就称为个值;否则就称为复合假设复合假设,例如,例如如果如果 ,并且,并且这
18、是一个简单假设。这是一个简单假设。如果如果因为因为的值未被确定,这是一个复合假设。的值未被确定,这是一个复合假设。为了检验虚拟假设(即检验其真实性),我们利用样本信息以获为了检验虚拟假设(即检验其真实性),我们利用样本信息以获得得检验统计量检验统计量(test statistic)。统计检验量常常就是未知参数的。统计检验量常常就是未知参数的点估计量。然后我们试图找出检验统计量的抽样或概率分布,并点估计量。然后我们试图找出检验统计量的抽样或概率分布,并利用利用置信区间置信区间或或显著性方法显著性方法去检验虚拟假设。去检验虚拟假设。接上例,考虑一个总体中的男子身高(接上例,考虑一个总体中的男子身高
19、(X):):现假设现假设问题是:这个检验统计量为问题是:这个检验统计量为 的样本会来自均值为的样本会来自均值为69的总的总体吗?直觉上,如果体吗?直觉上,如果 “足够接近足够接近”,我们也许不会拒绝虚,我们也许不会拒绝虚拟假设,否则我们宁可拒绝它而接受对立假设。拟假设,否则我们宁可拒绝它而接受对立假设。因为因为 ,所以检验统计量,所以检验统计量 的分布是:的分布是:既然知道了既然知道了 的概率分布,可以根据的概率分布,可以根据 建立建立的一个的一个100(1-)置信区间,然后看此置信区间是否包含置信区间,然后看此置信区间是否包含 。如果包含,就。如果包含,就不拒绝虚拟假设;如果不包含,就可拒绝
20、虚拟假设。不拒绝虚拟假设;如果不包含,就可拒绝虚拟假设。例如,取例如,取=0.05,将有一个,将有一个95%的置信区间。如果此区间包含的置信区间。如果此区间包含 ,由于这样建立起来的区间每由于这样建立起来的区间每100个中有个中有95个会含有个会含有 ,我们就不,我们就不拒绝虚拟假设。拒绝虚拟假设。怎样决定怎样决定 是否足够接近是否足够接近“”呢?有两种方法:呢?有两种方法:(1)置信区间法)置信区间法 (2)显著性检验法。)显著性检验法。X(1)置信区间法XXX置信区间法操作步骤:置信区间法操作步骤:因因 ,从而,从而Zi 是一个标准正态变量,于是由正态分布表知:是一个标准正态变量,于是由正
21、态分布表知:即即整理得:整理得:这就是这就是的一个的一个95%置信区间。一旦建立了这个区间,我们所要做置信区间。一旦建立了这个区间,我们所要做的不外是看的不外是看 是否落入此区间。如果落入,就不拒绝虚拟是否落入此区间。如果落入,就不拒绝虚拟假设,如果不落入则拒绝之。假设,如果不落入则拒绝之。例我们已建立我们已建立的一个的一个95%的置信区间,即的置信区间,即此区间显然不包含此区间显然不包含=69,因此我们能以,因此我们能以95%置信系数拒绝真置信系数拒绝真是是69的虚拟假设。的虚拟假设。落入拒绝域落入拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域用假设检验的语言说,我们所建立的置信区间叫做用假设检
22、验的语言说,我们所建立的置信区间叫做接受域接受域(acceptance region)。接受域以外的区域叫做虚拟假设的)。接受域以外的区域叫做虚拟假设的临临界域界域(critical region)或)或拒绝域拒绝域(regions of rejection)。接)。接受域的上下限(与拒绝域的分界线)叫做受域的上下限(与拒绝域的分界线)叫做临界值临界值(critical values)。)。拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验拒绝域是当原假设为真时,不太可能发生或发生概率很低的检验统计量的数值的集合。如果使用样本数据时所取得的检验统计量统计量的数值的集合。如果使用样本数据时
23、所取得的检验统计量的值落入了概率很低的区域中,则该检验统计量不太可能具有之的值落入了概率很低的区域中,则该检验统计量不太可能具有之前假设的分布,因此原假设不太可能为真。前假设的分布,因此原假设不太可能为真。因此,用假设检验的语言说,如果假设值落入接受区间,就不可因此,用假设检验的语言说,如果假设值落入接受区间,就不可拒绝虚拟假设;否则可以拒绝。拒绝虚拟假设;否则可以拒绝。在决定拒绝或不拒绝在决定拒绝或不拒绝H0时,我们可能犯两类错误:时,我们可能犯两类错误:(1)拒绝一个事实上是真的)拒绝一个事实上是真的H0。第第I类错误类错误(type I error)这种当虚拟假设为真而拒绝虚拟假设的错误
24、又称为据真这种当虚拟假设为真而拒绝虚拟假设的错误又称为据真错误。其概率通常用错误。其概率通常用表示,并称为显著性水平表示,并称为显著性水平(level of significance)。(2)没有拒绝一个不真的)没有拒绝一个不真的H0。第第II类错误类错误(type II error)即接受了错误的虚拟假设。这类错误的概率记为即接受了错误的虚拟假设。这类错误的概率记为,并把,并把不犯不犯II类错误的概率类错误的概率1-称为检验的功效(称为检验的功效(power of the test)。)。检验的功效就是它拒绝一个错误假设的能力。检验的功效就是它拒绝一个错误假设的能力。自然状态自然状态决策决策
25、H H0是对的是对的H H0是错的是错的拒绝拒绝I I类错误类错误无错无错不拒绝不拒绝无错无错IIII类错误类错误第一类错误就是拒真错误,为了降低第一类错误的概率,就第一类错误就是拒真错误,为了降低第一类错误的概率,就要尽可能的做接受的推断,随之带来的就是可能把假的也当要尽可能的做接受的推断,随之带来的就是可能把假的也当成真的接受了,这就导致纳伪错误的增加,即增加第二类错成真的接受了,这就导致纳伪错误的增加,即增加第二类错误发生的概率。误发生的概率。这样本容量固定的前提下,两类错误的概这样本容量固定的前提下,两类错误的概率不能同时减少。率不能同时减少。为了同时减少两类错误的概率就得增加样本容量
展开阅读全文