第四章统计推断课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第四章统计推断课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 统计 推断 课件
- 资源描述:
-
1、第四章 统计推断第一节 统计推断的意义与原理一、统计推断的意义和内容统计推断的意义和内容 统计推断,就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。统计推断包括统计假设检验和参数估计两部分内容。统计假设检验又称显著性检验,它是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。显著性检验的方法很多,常用的有t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。参数估计包括两个方面,一是参数的点估计,二是参数的区间估计。二、统计量的抽
2、样分布与统计推断的关系图图1 1 随机抽样和统计推断示意图随机抽样和统计推断示意图假设检验假设检验(定性定性)参数估计(定量)样本特征样本特征(统计量统计量)可知可知总体特征总体特征(参数参数)一般未知一般未知样本样本1 1样本样本2 2样本样本N N n n随机抽样随机抽样样本容量样本容量n n统计推断统计推断 总体总体 (N)(N)样本样本3 3三、假设检验1假设检验的基本原理 我们结合一个实例说明统计假设检验的基本原理。例如:将20只老鼠随机分为数目相等的两组,一组作对照不注射催产素,另一组注射,然后在规定的时间内测定每组各个体的血糖值。假定测定的结果对照组平均值为:=109.17,注射
3、催产素组为:=106.88,两样本平均数并不相等,其差值(表面效应)为:=109.17-106.88=2.29,这是否意味着注射与不注射催产素两种不同的处理,老鼠体内血糖含量一定存在有显著差异,即两相应总体血糖含量不等()呢?由于抽样的原因,两样本平均数之差(),即表面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的部分,到底后者存在与否,需要进行统计分析。计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成,也就是假设两样本所属总体无差异。抽样误差出现的概率可利用前面所介绍的抽样分布来计算,这里只要设定一概率标准,例如,表面效应由误差
4、造成的概率不大于5%便可推断表面效应不大可能由误差所引起 1221xx 统计假设检验的基本原理统计假设检验的基本原理:是根据试验目的对要比较的总体提出假设,先承认待检验的假设成立,然后观察在此假设前提下样本的出现是否属于小概率事件,如果是小概率事件,则有充分的理由怀疑或否定原假设,反之则不能否定原假设。2统计假设检验基本步骤统计假设检验基本步骤 例例:设某一肉用仔鸡常规饲养条件下50d体重的总体平均值为:=2250g,方差为:=62500 g 2。从该群体中随机选择25羽初生雏鸡,在常规饲养基础上添加某种中药添加剂饲养50d,测得该样本平均值为:=2375g,问添加中药添加剂是否对仔鸡50d体
5、重有影响?假设检验的基本步骤为:02x(1)根据实际需要对未知或不完全知道的总体)根据实际需要对未知或不完全知道的总体提出假设提出假设 无效假设H0:对需推知的总体参数提出的假设。(被直 接检验的假设称为原假设)备择假设HA:在拒绝无效假设后可供选择的假设。H0和HA是一对立事件,且构成完全事件系,即否定H0 就意味着接受HA,接受H0 就意味着否定HA。本例,无效假设H0为:,即用中药饲养的25羽雏鸡组成的样本所属的总体平均值与指定的正常饲养情况下的总体平均值之间无实质差异。备择假设HA为:,即用中药作添加剂和不用中药作添加剂,该肉鸡种50d体重的确存在着显著差异。0225002250(2)
6、在假定)在假定H0成立的前提下,根据统计量的抽样分布,计成立的前提下,根据统计量的抽样分布,计算实得差异由抽样误差造成的概率。算实得差异由抽样误差造成的概率。(构造合适的统计量构造合适的统计量)000000 125125125125125iHXXXXP XXXXP XP X 0对于本例来说,在成立的条件下,与 相差越远,就越大,发生的可能性就越小,说明抽样误差造成的概率就越小,计算 偏离程度大小用表示。因此计算实得差异由抽样误差造成的概率其实质就是计算抽样误差大于125的概率。因为与均表示抽样误差大于,所以就是本步骤所要计算的概率值。怎么求2;01XUnN?利用已知的总体方差和原假设提供的信息
7、,可以构造统计量:由于原总体服从正态分布,这个统计量服从标准正态分布,0001251252.5502.522.52.50.006211252 0.006210.0124xXPXPP UP UP UPX查附表得:;故:2200625002375g250025237522501252.50502500XXXXXgnXXU;在总体平均数为2250g(在H0成立下),方差为62500g2的正态总体中以样本容量为25进行抽样,抽得的一个样本平均数与总体平均数相差125g以上,由抽样误差造成的概率为0.0124。(3)根据小概率事件实际不可能性原理判断是否)根据小概率事件实际不可能性原理判断是否接受接受H
8、0 本例,在假定H0成立的前提下,经计算一个样本平均数与总体平均数相差125以上,这一事件由抽样误差造成的概率为0.0124,小于0.05,所以是一个小概率事件,根据小概率事件实际不可能性原理,可以获得如下结论:在H0成立的前提下饲喂含中药添加剂的一个样本,其平均值与没有饲喂中药添加剂的总体平均值相差125g以上不是由抽样误差所造成,的确是由饲喂中药添加剂所造成的。因此可以否定H0,接受HA。在H0成立的前提下,根据统计量的分布,计算实得差异(表面效应)由抽样误差造成的概率大于0.05,则实得差异(表面效应)由抽样误差造成的可能性较大,没有理由认为实得差异(表面效应)由两总体平均值不同而造成,
9、检验的结果应当接受H0,两个总体平均值“差异不显著”;如果实得差异(表面效应)由抽样误差造成的概率在0.010.05之间,表示两个总体平均值“差异显著”,应否定H0,接受HA;如果其概率值小于0.01,同样否定H0,接受HA,表示两总体间存在“极显著差异”。统计上,把否定H0的概率标准叫显著水平。用 表示,是个小概率,在生物学研究中,一般取0.05和0.01两个等级。假设检验的步骤可概括为:假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0,并设立备择假设HA;(2)确定检验的显著水平 ,在假定H0成立的前提下,根据统计量的抽样分布,计算实得差异(表面效应)由抽样误差造成的概率;(3
10、)根据这个概率与显著水平 比较的结果,由小概率事件实际不可能性原理进行差异显著性推断。(4)根据统计推断结果,结合相应的专业知识,给出一个专业的结论。3假设检验的几何学意义假设检验的几何学意义 假设检验是将统计量的分布分成两个不同的区域,一个为接受H0的区域,另一个是否定H0的区域。图图2 u分布统计假设检验的几何意义分布统计假设检验的几何意义 由标准正态分布(u分布)概率计算可知,P(|)=,所以接受区域和否定区域的临界值是 和 ,统计假设检验可由样本计算的|与 比较,确定是接受还是否定H0。上例中 2.5,大于 u 0.05=1.96,所以u落在否定区域内,但又小于 u 0.01=2.58
11、,所以实得差异由误差造成的概率在0.010.05间,“差异显著”。故否定 H0。假设检验的第二步也可以不直接计算实得差异(表面效应)由抽样误差造成的概率,而是用实得差异相对应的检验统计量的值与假设检验的临界值比较,判断差异显著性。方法如下:uuuu|uuu 0.0500.050.0100.01010.0520.010.0530.01AAUuPHuUuPHHUuPHH当时,统计假设检验接受,即要比较的总体均值之间无显著差异。当时,假设检验否定,接受,即要比较的总体均值之间存在显著差异。当时,假设检验否定,接受,即要比较的总体均值之间存在极显著差异。因此因此,假设检验步骤简写成假设检验步骤简写成:
12、1、建立假设;2、计算检验统计量;3、确定否定域(临界值),作出统计推断4两尾两尾(双侧双侧)检验和一尾检验和一尾(单侧单侧)检验检验 既考虑左边否定域又考虑右边否定域,即考虑统计量抽样分布曲线两侧(两个尾部)的检验称之为两尾检验。在生物学研究中两尾检验应用最为广泛。000HH:A:;在假设检验中,只有一个否定域(一侧)的假设检验叫一尾检验。即否定域在检验统计量抽样分布的一侧.000000000000AAAAHHHHHHHH63:;:(左尾或左侧检验)或:;:(右尾或右侧检验)课本(P):;:(左尾或左侧检验)或:;:(右尾或右侧检验)一尾检验与两尾检验的步骤相同,不同的是一尾检验将显著水平
13、的概率值放到一侧,而不是将其均分到左、右两侧,因此实际上采用的假设检验临界值是 和 。在相同 水平下,一尾检验否定区范围大于两尾检验,所以一尾检验更易否定H0(对差异识别能力强),因此,选用一尾检验,应根据专业知识和试验目的来判断是否有充足的依据。2u2t 相伴概率:是指在原假设成立时检验统计量观测值以及所有比它更为极端的可能值出现的概率之和,用P表示。0.006210.050.010.01240.9938P P UP P UP UP UP P U 例如:在上述例子中,检验统计量U的观测值为2.5,如果是右尾检验,相伴概率就是:=2.5,这说明这是个发生概率很小的事件,小于我们常用标准或;如果
14、是双尾检验,相伴概率就是:=2.52.52.5,同样也是个很小的概率。但如果是左侧检验,相伴概率就是:=2.5;这就不是一个小概率事件。5假设检验的两类错误假设检验的两类错误 犯这种错误的原因在于我们是根据小概率事件原理来确定否 当原假设实际上是正确的,而依据某一样本作出拒绝愿假设的定域进而进行推断的,但事实上小概率事件并不是绝对不发生,一旦发判断,这就将正确的假设误认为是错误的,我们将这种“生了就否定原假设,因而就犯了弃真错误。犯弃真错误错以真为假”误的概率就的错误称为弃真错等于我们所规定的误,习惯叫它第一类错误或小概率,即显著性水I型错误。平。我们可以通过选择显著性水平来控制犯弃真错误的概
15、率。犯这种错误的原因是在原 另一种错误,原假设实际假设(错误的)下检验统计量抽样上是错的,而依据某一样本作出了接受原假设的推断,也就是将错误分布的接受域与检验统计量的真实抽样分布发生部分重叠,当检验统的假设误认为是正确的,我们将这种“以假计量的取值落在了这个重叠的区域中时,我为真”的错误叫做纳伪错们将它当成了原假设下抽误样,习分布惯叫它第2类错误或II型错误的抽样值。因而。犯了纳伪错误。犯这种错误的概率等于真实抽样分布中重叠部分的面积,用 表示。第二节 对单个和两个总体平均数的假设检验一、单个平均数的假设检验 单个平均数的假设检验是检验一个样本所属的总体平均数与一个特定总体平均数0间是否存在显
16、著差异的一种统计方法,也可理解为检验一个样本是否来自某一特定总体的统计分析方法。根据统计假设检验的基本原理可知,假设检验的关键是根据统计量的分布计算实得差异(表面效应)由抽样误差造成的概率。(一)、总体方差已知时单个平均数的假设检验 当总体方差 已知时,根据样本平均数抽样分布的性质,无论样本容量是大是小,均可用u分布计算实得差异由抽样误差造成的概率,所以称u检验。2 例1:测定了某品种37头犊牛100g血液中总蛋白的含量,其平均数为4.263g;该品种成年母牛100g血液中总蛋白含量为7.570g,标准差为1.001。问该品种犊牛和成年母牛血液中总蛋白含量是否存在显著差异?1、建立假设 H 0
17、:犊牛和成年母牛间血液中总蛋白含量无显著差异;HA:犊牛和成年母牛间血液中总蛋白含量存在显著差异。2U本例总体方差已知,可采用 检验0.0102:1.0014.2637.570.165;20.040.165373:0.01;2.58;0.01;,XXAXUnUuPHH 计算检验统计量查表推断取统计假设检验否定接受即犊牛和成年母牛间血液中总蛋白含量存在极显著差异。(二)、总体方差未知时单个平均数的假设检验 例2:某屠宰场收购了一批商品猪,一位有经验的收购人员估计这批猪的平均体重为100 kg,现随机抽测10头猪进行称重,得体重数据如下:115,98,105,95,90,110,104,108,9
18、2,118(kg),试检验此收购人员的估计是否正确?1、建立假设 H 0:这批猪的平均体重为100 kg;HA:这批猪的平均体重不等于100 kg。2、计算检验统计量2,当总体方差未知时 应用t分布计算实得差异由样本误差造成的概率2,本例总体方差未知 且样本很小 用t检验 0.05(9)0.05(9)00.05,1 10 19,2.262,0.05,dfntttPH 3、查表推断:接受即该收购人员的估计基本正确。9.57103.5;9.57;3.0310103.5 1001.1553.03XXSXSSnXtS 例3:正常情况下成年男子的脉搏数为72次/min,现随机检查25名慢性胃炎所至脾虚男
展开阅读全文