第7章-参数估计PPT课件.ppt

上传人（卖家）：三亚风情

文档编号：2760556

上传时间：2022-05-24

格式：PPT

页数：69

大小：969.50KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

28 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《第7章-参数估计PPT课件.ppt》由用户（三亚风情）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 参数估计 PPT 课件

资源描述：: 1、第七章参数估计第七章参数估计大学生每周上网花多少时间？大学生每周上网花多少时间？回答类别回答类别人数（人）人数（人）频率（频率（%）3小时以下小时以下321636小时小时3517.569小时小时3316.5912小时小时2914.512小时以上小时以上7135.5合计合计200100 平均上网时间为平均上网时间为8.58小时，标准差为小时，标准差为0.69小时。全校学生小时。全校学生每周的平均上网时间是多少？每周上网时间在每周的平均上网时间是多少？每周上网时间在12小时以上小时以上的学生比例是多少？你做出估计的理论依据是什么？的学生比例是多少？你做出估计的理论依据是什么？学习目标学习目标1、掌
2、握参数估计的基本方法和原理。、掌握参数估计的基本方法和原理。2、理解并掌握置信区间和置信水平的、理解并掌握置信区间和置信水平的含义。含义。3、理解并掌握评价估计量的标准。、理解并掌握评价估计量的标准。4、掌握一个总体参数的区间估计方法，、掌握一个总体参数的区间估计方法，了解两个总体参数区间估计的基本了解两个总体参数区间估计的基本方法。方法。5、掌握估计一个总体均值和总体比例、掌握估计一个总体均值和总体比例时样本量的确定方法。时样本量的确定方法。1.参数估计：总体分布类型已知，仅需对分布参数估计：总体分布类型已知，仅需对分布的未知参数进行的估计的未知参数进行的估计2.估计量：用于估计总体参数的
3、随机变量估计量：用于估计总体参数的随机变量u如样本均值，样本比例、样本方差等如样本均值，样本比例、样本方差等例如例如: 样本均值就是总体均值样本均值就是总体均值的一个估计量的一个估计量3.估计值：估计参数时计算出来的统计量的具体值估计值：估计参数时计算出来的统计量的具体值u如果样本均值如果样本均值 x =80，则，则80就是就是的估计值的估计值4.参数用参数用表示，估计量表示，估计量用用表示表示一、一、参数估计的一般问题参数估计的一般问题表示表示用用估计量估计量参数估计的方法参数估计的方法估估计计方方法法点点估估计计区间估计区间估计点估计点估计 (point estima
4、te)用样本的估计量的某个取值直接作为总体参数用样本的估计量的某个取值直接作为总体参数的估计值的估计值例如：用样本均值直接作为总体均值的估计；用例如：用样本均值直接作为总体均值的估计；用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计无法给出估计值接近总体参数程度的信息无法给出估计值接近总体参数程度的信息l虽然在重复抽样条件下，点估计的均值可望等于虽然在重复抽样条件下，点估计的均值可望等于总体真值，但由于样本是随机的，抽出一个具体总体真值，但由于样本是随机的，抽出一个具体的样本得到的估计值很可能不同于总体真值的样本得到的估计值很可能不同于总体真值l一个点估计
5、量的可靠性是由它的抽样标准误差来一个点估计量的可靠性是由它的抽样标准误差来衡量的，这表明一个具体的点估计值无法给出估衡量的，这表明一个具体的点估计值无法给出估计的可靠性的度量计的可靠性的度量二战期间，盟军非常想知道德军总共制造了多少辆坦克。德国二战期间，盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的，他们把坦克从人在制造坦克时是墨守成规的，他们把坦克从1开始进行了连开始进行了连续编号。在战争过程中，盟军缴获了一些敌军坦克，并记录了续编号。在战争过程中，盟军缴获了一些敌军坦克，并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢？它们的生产编号。那么怎样利用这些
6、号码来估计坦克总数呢？在这个问题中，总体参数是未知的坦克总数在这个问题中，总体参数是未知的坦克总数N,而缴获坦克的编而缴获坦克的编号则是样本。制造出来的坦克总数肯定大于等于记录的最大编号则是样本。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少，我们先找到被缴获坦克编号。为了找到它比最大编号大多少，我们先找到被缴获坦克编号的平均值，并认为这个值是全部编号的中点。因此样本均值号的平均值，并认为这个值是全部编号的中点。因此样本均值乘以乘以2就是总数的一个估计；当然要特别假设缴获的坦克代表就是总数的一个估计；当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种估计了所有
7、坦克的一个随机样本。这种估计N的公式的缺点是：不的公式的缺点是：不能保证均值的能保证均值的2倍一定大于记录中的最大编号。倍一定大于记录中的最大编号。N的另一个点估计公式是：用观测到的最大编号乘以因的另一个点估计公式是：用观测到的最大编号乘以因子子1+1/n，其中，其中 n 是被俘虏坦克个数。假如你俘虏了是被俘虏坦克个数。假如你俘虏了10 辆坦克，其中最大编号是辆坦克，其中最大编号是50，那么坦克总数的一个估，那么坦克总数的一个估计是（计是（1+1/10) 50=55。此处我们认为坦克的实际数略。此处我们认为坦克的实际数略大于最大编号。大于最大编号。从战后发现的德军记录来看，盟军的估计值非常接近
8、从战后发现的德军记录来看，盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通所生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮！。统计学家们做得比间谍们更漂亮！资料来源：资料来源：GUDMUND R.IVERSEN和和MARY GERGRN著，吴喜之等译：著，吴喜之等译：统计学统计学基本概念和基本概念和方法方法，高等教育出版社，施普林格出版社，高等教育出版社，施普林格出版社，2000。点估计量的常用评价准则：无偏性无偏性l无偏性：估计量的数学期望与总体待估参数的
9、真值相等：( )E有偏有偏点估计量的常用评价准则：有效性l 在两个无偏估计量中方差较小的估计量较为有效。的抽样分布的抽样分布的抽样分布的抽样分布12估计量的常用评价准则：一致性l指随着样本容量的增大，估计量越来越接近被估计的总体参数。较小的样本容量较小的样本容量较大的样本容量较大的样本容量P(X )区间估计l根据事先确定的置信度1 - 给出总体参数的一个估计范围。l置信度1 - 的含义是：在同样的方法得到的所有置信区间中，有100(1- )% 的区间包含总体参数。 l抽样分布是区间估计的理论基础。估计值估计值(点估计点估计)置信下限置信下限置信上限置信上限置信区间置信区间置信区间的表述置
10、信区间的表述 (95%的置信区间的置信区间) 我没有抓住参数！我没有抓住参数！二、一个总体参数的区间估计二、一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计样本统计量量均值均值比例比例方差方差2xp2s（一）总体均值的区间估计（一）总体均值的区间估计总体均值区间的一般表达式：总体均值的置信区间是由样本均值加减估计误差得到的估计误差由两部分组成：一是点估计量的标准误差，它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时，统计量分布两侧面积为的分位数值，它取决于事先所要求的可靠程度总体均值在置信水平下的置信区间可一般性地表达为样本均值样本均值分位数值分位数值样本均值的标准
11、误差样本均值的标准误差相关理论总体正态总体正态？n30？2 2已已知知？否是是否否是实际中总体方差总是未知的，因实际中总体方差总是未知的，因而这是应用最多的公式。在大样而这是应用最多的公式。在大样本时本时t值可以用值可以用z值来近似。值来近似。根据中心极限定理得根据中心极限定理得到的近似结果。到的近似结果。未知时用未知时用s来估计。来估计。nZx 2 nstx2 nZx 2 增大增大n？数学？数学变换变换?Example：用用SPSS进行进行总体均值总体均值区间估计区间估计l例：儿童电视节目的赞助商希望了解儿童每周看电例：儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对视的时间。下
12、面是对100名儿童进行随机调查的结名儿童进行随机调查的结果（小时）。计算平均看电视时间果（小时）。计算平均看电视时间95%的置信区间。的置信区间。39.719.534.727.041.315.120.531.318.317.021.529.915.016.436.823.424.128.923.424.440.646.423.639.435.519.529.331.220.634.915.531.638.938.727.226.514.715.628.424.043.920.629.19.521.042.413.932.829.832.933.038.028.720.619.738.637.1
13、17.015.123.421.021.829.321.322.823.432.511.343.830.815.823.220.333.530.037.824.426.929.027.727.122.036.123.022.126.522.926.930.225.223.835.321.635.730.822.724.521.926.550.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)总体均值总体均值在在1- 置信水平下的置信区间为置信水平下的置信区间为96. 1z95%,-100,1n8.37284,s27.191,x:/2 解解 )85.28,53.25(1037284. 8
14、96. 1191.272/ nSX 儿童每周看电视的平均时间的儿童每周看电视的平均时间的SPSS输出结果（数据：输出结果（数据：tv.xls）操作：分析操作：分析-描述统计描述统计-探索探索统计量标准误均值27.191.8373均值的 95% 置信区间下限25.530上限28.8525% 修整均值26.977中值26.500方差70.104标准差8.3728极小值9.5极大值50.3（二）总体比例的区间估计（二）总体比例的区间估计1.假定条件l总体服从二项分布l可以由正态分布来近似lnp(成功次数)和n(1-p)(失败次数)均应该大于52. 使用正态分布统计量 zN(0,1)n)(1pz 3.
15、总体比例总体比例在在1- 置信水平下置信水平下的置信区间为的置信区间为nppzp)-1(2 样本比例样本比例分位数值分位数值样本比例的标准误差样本比例的标准误差总体比例的置信区间：例子总体比例的置信区间：例子解：显然有解：显然有因此可以用正态分布进行估计。因此可以用正态分布进行估计。 /2=1.6450215. 0217. 0995)217. 01(217. 0645. 1217. 0)1(2 nppZp 结论：我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。19861986年对悉尼年对悉尼995995名青少年的名青少年的随机调查发现随机调查发现，有，
16、有216216人每天人每天都抽烟。试估都抽烟。试估计悉尼青少年计悉尼青少年中每天都抽烟中每天都抽烟的青少年比例的青少年比例的的90%90%的置信区的置信区间。间。5)1(, 5 pnpnSPSS的计算结果的计算结果l在SPSS中将“是否吸烟”输入为取值为1和0的属性变量，权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。统计量标准误均值.2171.01308均值的 90% 置信区间下限.1956上限.23865% 修整均值.1857中值.0000方差.170标准差.41247极小值.00极大值1.00范围1.00四分位距.00（三）总体方差的区间估计（三）总体方差的区间估
17、计1.估计一个总体的方差或标准差估计一个总体的方差或标准差2.假设总体服从正态分布假设总体服从正态分布3. 总体方差总体方差 2 的点估计量为的点估计量为s2,且且4. 总体方差在总体方差在1- 置信水平下的置信区间为置信水平下的置信区间为 ) ) ) )11222 nsn ) ) ) )2212222211 snsn总体方差的区间估计总体方差的区间估计(图示图示)总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例】【例】一家食品生产企业以生产袋装食品为主，现从某一家食品生产企业以生产袋装食品为主，现从某天生产的一批食品中随机抽取了天生产的一批食品中随机抽取了25袋，测得每袋重量如袋
18、，测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解:已知已知n25，1- 95% ,根据样本数据计算得根据样本数据计算
19、得 s2 =93.21 2置信度为置信度为95%的置信区间为的置信区间为 4011.12)24()1(2975. 0212 n3641.39)24()1(2025. 022 n ) ) ) )39.18083.564011.1221.931253641.3921.9312522 该企业生产的食品总体重量标准差的该企业生产的食品总体重量标准差的95%置信区置信区间为间为7.54g13.43g均值均值比例比例方差方差大样本大样本小样本小样本大样本大样本 2 2分布分布 2 2已知已知 2 2已知已知Z Z分布分布 2 2未知未知Z Z分布分布Z Z分布分布Z Z分布分布 2 2未知未知t t分布分
20、布一个总体参数的区间估计一个总体参数的区间估计(小结小结)三、两个总体参数的区间估计三、两个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均值差比例差方差比2121222121xx 21pp 2221ss（一）均值之差区间的一般表达式（一）均值之差区间的一般表达式两个总体均值的置信区间是由两个样本均值之差加减估计误差得到的估计误差由两部分组成：一是点估计量的标准误差，它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时，统计量分布两侧面积为的分位数值，它取决于事先所要求的可靠程度两个总体均值之差(1-2)在置信水平下的置信区间可一般性地表达为 ( x1- x2
21、)分位数值分位数值 ( x1- x2 )的标准误差的标准误差两个总体均值之差的估计两个总体均值之差的估计(独立大样本独立大样本)1. 假定条件假定条件两个两个总体都服从正态分布，总体都服从正态分布， 1、 2已知已知若不是正态分布若不是正态分布, 可以用正态分布来近似可以用正态分布来近似(n1 30和和n2 30)两个样本是独立的随机样本两个样本是独立的随机样本2. 使用正态分布统计量使用正态分布统计量 z)1 , 0()()(2221212121Nnnxxz 两个总体均值之差的估计两个总体均值之差的估计 (大样本大样本)1. 1， 2已知时，已知时，两个总体均值之差两个总体均值之差 1- 2
22、在在1- 置信水平下的置信区间为置信水平下的置信区间为222121221)(nnzxx 222121221)(nsnszxx 1、 2未知时，未知时，两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例】【例】某地区教育管理某地区教育管理部门想估计两所中学的部门想估计两所中学的学生高考时的英语平均学生高考时的英语平均分数之差，为此在两所分数之差，为此在两所中学独立抽取两个随机中学独立抽取两个随机样本，有关数据如右表样本，有关数据如右表。建立两所中学高考英。建立两所中学高考英语平均分
23、数之差语平均分数之差95%的的置信区间置信区间两个样本的有关数据两个样本的有关数据中学中学1中学中学2n1=46n2=33S1=5.8 S2=7.2861x782x两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解: 两个总体均值之差在两个总体均值之差在1- 置信水平下的置信区间为置信水平下的置信区间为两所中学高考英语平均分数之差两所中学高考英语平均分数之差95%的置的置信区间为信区间为5.03分分10.97分分)97.10,03. 5(97. 28332 . 7468 . 596. 1)7886()(22222121221 nsnszxx 两个总体均值之差的区间估计两
24、个总体均值之差的区间估计(独立小样本独立小样本)两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 12 2 2 22 2 )1.假定条件假定条件两个两个总体都服从正态分布总体都服从正态分布两个总体方差未知但相等：两个总体方差未知但相等： 1= 2两个独立的小样本两个独立的小样本(n130和和n230)2. 总体方差的合并估计量总体方差的合并估计量2)1()1(212222112 nnsnsnsp估计估计量量 x1 1- - x2 2的抽样标准差的抽样标准差21221211nnsnsnsppp 两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 12
25、 2 2 22 2 )4. 两个样本均值之差的标准化两个样本均值之差的标准化)2(11)()(21212121 nntnnsxxtp 5.两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信水平下的置信区间为置信区间为 ) ) ) ) 21221221112nnsnntxxp 两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例】【例】为估计两种方法组装产品所需时间的差异，分别对两种不为估计两种方法组装产品所需时间的差异，分别对两种不同的组装方法各随机安排同的组装方法各随机安排12名工人，每个工人组装一件产品所需名工人，每个工人组装一件产品所需的时间的时间(单位
26、：单位：min)下如表。假定两种方法组装产品的时间服从正下如表。假定两种方法组装产品的时间服从正态分布，且方差相等。试以态分布，且方差相等。试以95%的置信水平建立两种方法组装产的置信水平建立两种方法组装产品所需平均时间差值的置信区间品所需平均时间差值的置信区间两个方法组装产品所需的时间两个方法组装产品所需的时间方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解: 根据样本
27、数据计算得根据样本数据计算得合并估计量为合并估计量为两种方法组装产品所需平均时间之差的置信区间两种方法组装产品所需平均时间之差的置信区间为为0.14min7.26min5 .321 x996.1521 s8 .282 x358.1922 s677.1721212358.19) 112(996.15) 112(2 ps56. 37 . 3121121677.170739. 2)8 .285 .32( 某公司为了解男女推销员的推销能力是否有差某公司为了解男女推销员的推销能力是否有差别，随机抽取别，随机抽取16名男推销员和名男推销员和25名女推销员进名女推销员进行测试。男推销员的平均销售额为行测试
28、。男推销员的平均销售额为30250元，标元，标准差为准差为18400元，女推销员的平均销售额为元，女推销员的平均销售额为33750元，标准差为元，标准差为13500元。假设男女推销员元。假设男女推销员的销售额服从正态分布，且方差相等。试建立的销售额服从正态分布，且方差相等。试建立男女推销员销售额之差的男女推销员销售额之差的95%的置信区间。的置信区间。解解假设用随机变量假设用随机变量，分别表示男女推销员的销售额，则由已分别表示男女推销员的销售额，则由已知条件有知条件有又因两总体方差相等，可以估计出它们的共同方差：又因两总体方差相等，可以估计出它们的共同方差：元元元元元元，元元，13
29、5003375018400302502211sxsx,21xx ,)22221222211215568125161350012518400116211nnsnsnsp)()(),(65681356810068350011221221221nnsnntxxp我们有我们有95%的把握认为：男推销员的销售额既有可能比女推销员多的把握认为：男推销员的销售额既有可能比女推销员多6568元，也有可能比女推销员少元，也有可能比女推销员少13568元，所以男女推销员的推销能元，所以男女推销员的推销能力没有显著差别。力没有显著差别。两个总体均值之差的估计两个总体均值之差的估计(小样本小样本: 1 12 2 2
30、22 2 )1.假定条件假定条件两个两个总体都服从正态分布总体都服从正态分布两个总体方差未知且不相等：两个总体方差未知且不相等： 1 2两个独立的小样本两个独立的小样本(n130和和n230, n1 n2)2. 使用统计量使用统计量)()()(2221212121vtnsnsxxt 两个总体均值之差的估计两个总体均值之差的估计(独立小样本独立小样本: 1 12 2 2 22 2 )两个总体均值之差两个总体均值之差 1- 2在在1- 置信水平下的置信水平下的置信区间为置信区间为 ) )222121221)(nsnsvtxx ) ) ) )1222221121212222121 nnsnnsnsn
31、sv两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例】【例】沿用前例。假定第一种方法随机安排沿用前例。假定第一种方法随机安排12名工人，第二种方名工人，第二种方法随机安排法随机安排8名工人，即名工人，即n1=12，n2=8 ，所得的有关数据如表。假，所得的有关数据如表。假定两种方法组装产品的时间服从正态分布，且方差不相等。以定两种方法组装产品的时间服从正态分布，且方差不相等。以95%的置信水平建立两种方法组装产品所需平均时间差值的置信的置信水平建立两种方法组装产品所需平均时间差值的置信区间区间两个方法组装产品所需的时间两个方法组装产品所需的时间方法方法1方法方法228.
32、336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.2两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解: 根据样本数据计算得根据样本数据计算得自由度为自由度为两种方法组装产品所需平均时间之差的置信区间为两种方法组装产品所需平均时间之差的置信区间为0.192min9.058mni5.321 x996.1521 s875.272 x014.2322 s ) ) ) ) ) ) ) )13188
33、.13188014.2311212996.158014.2312996.152221222221121212222121 nnsnnsnsnsv ) )433. 4625. 48014.2312996.151604. 2)875.275 .32()(222121221 nsnsvtxx 两个总体均值之差的估计两个总体均值之差的估计(匹配大样本匹配大样本)假定条件假定条件两个匹配的大样本两个匹配的大样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布两个总体均值之差两个总体均值之差 d = 1- 2在在1- 置信水置信水平下的置信区间为平下的置
34、信区间为nzdd2对应差值的均值对应差值的均值两个总体均值之差的估计两个总体均值之差的估计(匹配小样本匹配小样本)假定条件假定条件两个匹配的小样本两个匹配的小样本(n1 30和和n2 30)两个总体各观察值的配对差服从正态分布两个总体各观察值的配对差服从正态分布两个总体均值之差两个总体均值之差 d= 1- 2在在1- 置信水置信水平下的置信区间为平下的置信区间为nsntdd) 1(2两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)【例】患有高血压的【例】患有高血压的10名男患者正在进行一名男患者正在进行一种锻炼与饮食的系统种锻炼与饮食的系统调养调养,以期降低血压。以期降低血压
35、。表中给出每个病人训表中给出每个病人训练开始时和六个月后练开始时和六个月后的舒张压（单位：的舒张压（单位：mmHg）。由此数据）。由此数据集，试确定集，试确定 (开始时开始时与六个月后的差的均与六个月后的差的均值）的值）的99%置信区间置信区间，假定差值总体服从，假定差值总体服从正态分布。正态分布。病人病人起始起始六个六个后后差值差值1141142-12169165431581508418017645147143461601573717517058163157691481435101631621dd两个总体均值之差的估计两个总体均值之差的估计(例题分析例题分析)解解
36、: 根据样本数据计算得根据样本数据计算得高血压患者开始时与六个月后的差的均值的高血压患者开始时与六个月后的差的均值的99%置信区间置信区间为为1.32 mmHg6.48 mmHg9 . 310391 dniindd5144. 21)(12 dniidndds58. 29 . 3105144. 225. 39 . 3)1(2 nsntdd 1. 假定条件假定条件两个两个总体服从二项分布总体服从二项分布大样本大样本两个样本是独立的两个样本是独立的2. 两个总体比例之差两个总体比例之差 1- 2在在1- 置信水平下置信水平下的置信区间为的置信区间为（二）两个总体比例之差的区间估计（二）两个总体比例之
37、差的区间估计 ) )222111221)1()1(nppnppzpp 两个总体比例之差的估计两个总体比例之差的估计(例题分析例题分析)两个总体比例之差的估计两个总体比例之差的估计 (例题分析例题分析) 解解:假设用假设用p1， p2分别表示某电视节目城市和农村的收视率分别表示某电视节目城市和农村的收视率，则由已知条件可知，则由已知条件可知，n1=500 ，n2=400， p1=45%， p2=32%， 1- =95%， z /2=1.96， 1 1- - 2置信度为置信度为95%的置信区间为的置信区间为城市与农村收视率差值城市与农村收视率差值95%的置信区间为的置信区间为6.68%19.32%
38、 ) ) ) ) ) )%32.19,%68. 6%32. 6%13400%)321(%32500%)451(%4596. 1%32%45)1()1(222111221 nppnppzpp （三）两个总体方差比的区间估计（三）两个总体方差比的区间估计比较两个总体的方差比比较两个总体的方差比用两个样本的方差比来判断用两个样本的方差比来判断如果如果S12/ S22接近于接近于1,说明两个总体方差很接近说明两个总体方差很接近如果如果S12/ S22远离远离1,说明两个总体方差之间存在差异说明两个总体方差之间存在差异3.总体方差比在总体方差比在1- 置信水平下的置信区间为置信水平下的置信区间为2122
39、21222122221 FssFss),(1),(1222121nnFnnF 两个总体方差比的区间估计两个总体方差比的区间估计(图示图示)总体方差比的1的置信区间方差比置信区间示意图方差比置信区间示意图两个总体方差比的区间估计两个总体方差比的区间估计(例题分析例题分析)5201x26021s4802x28022s两个总体方差比的区间估计两个总体方差比的区间估计 (例题分析例题分析)解解:根据自由度根据自由度 n1=25-1=24 ，n2=25-1=24，查得，查得 F /2(24，24)=1.98， F1- /2(24，24)=1/1.98=0.505 12 / 22置信度为置信度为90%的置
40、信区间为的置信区间为男女学生生活费支出方差比的置信区间为男女学生生活费支出方差比的置信区间为0.471.84 84.147.0505.028026098.128026022212221 即即两个总体参数的区间估计两个总体参数的区间估计(小结小结)均值差均值差比例差比例差方差比方差比独立大样本独立大样本独立小样本独立小样本匹配样本匹配样本独立大样本独立大样本 1 12 2、 2 22 2已已 1 12 2、 2 22 2未未Z Z分布分布Z Z分布分布 1 12 2、 2 22 2已知已知 1 12 2、 2 22 2未知未知Z Z分布分布 1 12 2= = 2 22 2 1 12 2 2 2
41、2 2正态总体正态总体F F分布分布Z Z分布分布t t分布分布t t分布分布Z分布分布t分布分布四、必要样本量的计算样本量越大抽样误差越小。由于调查成本方面的原因，在调查中我们总是希望抽取满足误差要求的最小的样本量。l实际抽样误差l抽样平均误差l最大允许误差实际抽样误差l样本估计值与总体真实值之间的绝对离差称为实际抽样误差。l由于在实践中总体参数的真实值是未知的，因此实际抽样误差是不可知的；l由于样本估计值随样本而变化，因此实际抽样误差是一个随机变量。| 抽样平均误差抽样平均误差l抽样平均误差：样本均值的标准差，也就是前面说的标准误。它反映样本均值（或比例）与总体均值（比例）的平均差异程
42、度。l例如对简单随机抽样中的样本均值有：或（不重复抽样）l我们通常说“抽样调查中可以对抽样误差进行控制”，就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括：总体内部的差异程度；样本容量的大小；抽样的方式方法。nx1NnNnx2)(E最大允许误差l最大允许误差（allowable error)：在确定置信区间时样本均值（或样本比例）加减的量，一般用E来表示，等于置信区间长度的一半。在英文文献中也称为margin of error。l置信区间=l最大允许误差是人为确定的，是调查者在相应的置信度下可以容忍的误差水平。Ex 如何确定必要样本量？l必要样本量受以下几个因素的影响：1、总体
43、标准差。总体的变异程度越大，必要样本量也就越大。2、最大允许误差。最大允许误差越大，需要的样本量越小。3、置信度1- 。要求的置信度越高，需要的样本量越大。4、抽样方式。其它条件相同，在重复抽样、不重复抽样；简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。简单随机抽样下估计总体均值时样本容量的确定2222/2/,EZnnZEl式中的总体方差可以通过以下方式估计：l根据历史资料确定l通过试验性调查估计简单随机抽样下估计总体比例时样本容量的确定222/)1 (,)1 (2/EZnnZEl式中的总体比例可以通过以下方式估计：l根据历史资料确定l通过试验性调查估计l取为0.5样本量的
44、确定（实例1）需要多大规模的样本才能在需要多大规模的样本才能在 90% 的置信的置信水平上保证均值的误差在水平上保证均值的误差在 5 之内之内? 前前期研究表明总体标准差为期研究表明总体标准差为 45.nZE=222222(1645) (45)(5)219.2 220.向上取整样本量的确定（实例2）一家市场调研公司一家市场调研公司想估计某地区有电想估计某地区有电脑的家庭所占的比脑的家庭所占的比例。该公司希望对例。该公司希望对比例比例p的估计误差的估计误差不超过不超过0.05，要求，要求的可靠程度为的可靠程度为95%，应抽多大容量的样应抽多大容量的样本（没有可利用的本（没有可利用的p估计值）？估
45、计值）？解: 已知E=0.05，=0.05，Z/2=1.96，当未知时取为0.5。385)05. 0()5 . 01)(5 . 0()96. 1 ()1 (22222EZn实例3你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有 95% 置信度使得样本均值的误差在$50 以内。过去的研究表明约为 $400。需要多大的样本容量?nZE=222222(196) (400)(50)24586246.p 经常不断地学习,你就什么都知道。你知道得越多,你就越有力量p Study Constantly, And You Will Know Everything. The More You Know, The More Powerful You Will Be写在最后谢谢你的到来学习并没有结束，希望大家继续努力Learning Is Not Over. I Hope You Will Continue To Work Hard演讲人：XXXXXX 时间：XX年XX月XX日

展开阅读全文