书签 分享 收藏 举报 版权申诉 / 48
上传文档赚钱

类型第9讲大学统计学课件-抽样调查.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2603066
  • 上传时间:2022-05-10
  • 格式:PPT
  • 页数:48
  • 大小:465KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第9讲大学统计学课件-抽样调查.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    大学 统计学 课件 抽样调查
    资源描述:

    1、按随机原则抽取样本单位节约人力、物力和财力可靠性高 三、抽样推断中常用的几个基本概念三、抽样推断中常用的几个基本概念 全及总体和抽样总体全及总体和抽样总体 全及总体指研究对象的全部单位,即具有同一性质的若干单位的集合体,简称总体,抽样调查中又叫全及总体。无限总体包含的单位数包含的单位数 N 是无限的或相对无限是无限的或相对无限有限总体包含的单位数包含的单位数 N 是有限是有限抽样总体抽样总体也叫子样,简称样本。大样本 n 30小样本 n30全及指标和抽样指标全及指标和抽样指标 全及指标根据全及总体各个单位的标志值计算 的反映其某种特征的综合指标 _全及平均数(总体平均数)(X)全及总体某一变全

    2、及总体某一变 量值的算术平均数量值的算术平均数全及成数(总体成数)(P)全及总体具有某种标全及总体具有某种标 志的单位数在总体中所占的比重志的单位数在总体中所占的比重总体方差(2)和总体标准差()测定全及总体标测定全及总体标 志变异程度的指标志变异程度的指标抽样指标根据抽样总体各个单位标志值计算的综合 指标,与全及指标相对应抽样平均数(x)抽样总体中某一变量抽样总体中某一变量值值(观测值观测值)的算术平均数的算术平均数抽样成数(p)具有某种标志的单位数具有某种标志的单位数在抽样总体在抽样总体 中所占的比重中所占的比重样本方差(s2)和样本标准差(s)说明说明抽样总体标志变异程度的指标抽样总体标

    3、志变异程度的指标重复抽样重复抽样从全及总体从全及总体N个单位中抽取个单位中抽取n个样本,每个样本,每 次从总体中随机抽出一个单位后,再放次从总体中随机抽出一个单位后,再放 回总体中重新参加下一次抽取回总体中重新参加下一次抽取不重复抽样不重复抽样从全及总体从全及总体N个单位中抽取个单位中抽取n个样本,个样本, 当某一个单位被随机抽出后,不再放当某一个单位被随机抽出后,不再放 回总体回总体 第二节 抽样平均误差 一、抽样误差的概念及其影响程度一、抽样误差的概念及其影响程度在统计调查中,调查资料与实际情况在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。不一致,两者的偏离称为统计误差。

    4、调查误差代表性误差技术性误差登记性误差责任性误差系统性误差随机误差抽样误差抽样误差即指随机误差,这种误差是抽样调即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。查固有的误差,是无法避免的。 xXpP 抽抽样样误误差差就就是是指指样样本本指指标标和和总总体体指指标标之之间间数数量量上上的的差差别别,即即、。抽样平均误差抽样平均误差 所有可能样本抽样误差的平均数,即一系列抽样指标的抽样平均数或抽样成数的标准差x抽样平均数的抽样平均误差p抽样成数的抽样平均误差抽样平均误差的计算方法抽样平均误差的计算方法重复抽样情况下抽样平均数的平均误差计算重复抽样情况下抽样平均数的平均误差计算。样本可能数

    5、目的个数样成数样本平均指标个数或抽全及总体平均数;抽样总体平均数;抽样平均数的平均误差式中)()(2KXxKXxxx 在在N中抽出中抽出n样本,从排列组合中可以有样本,从排列组合中可以有各种各样的样本组:各种各样的样本组:重复抽样:重复抽样:N Nn n不重复抽样:不重复抽样:CnN2 1020304050X30()525()五户家庭三月份购买某商品的支出:元, 元, 元, 元, 元元现从五户中抽取二户作调查,如果为重复抽样 考虑顺序种排列组合如下:例例1010-20 4002015-15 2253020-10 1004025 -5 255030 0 01015-15 2252020-10 1

    6、003025 -5 254030 0 05035 5 251020-10 1002025 -5 253030 0 0 x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本x样样本本平平均均数数xX 误误差差 2xX 抽抽取取样样本本4035 5 25504010 1001025 -5 252030 0 03035 5 25404010 100504515 2251030 0 02035 5 25304010 100404515 22550 505020 400合 计-2 500接左:接左:)( )(10252500 )( 2为样本配合总数元抽样平均误差nKXxx以上资料编成次数分配表

    7、如下:x样本数样本数f (f (即次数分配即次数分配) )101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计 25 -xX 2(xX) ff 重复纯随机抽样条件下,抽样平均误差计算重复纯随机抽样条件下,抽样平均误差计算样本总体单位数。全及总体标准差;抽样平均数的平均误差式中nnnxx2没有全及总体标准差资料时,用抽样总体标准差没有全及总体标准差资料时,用抽样总体标准差 s s 代替代替nsnsx2nPPPPpP)1 ()1 (抽样成数的平均误差总体成数的标准差没有全及总体标准差资料时,用抽样总体标准差没有全及总体标准差资料时,用抽样总体

    8、标准差 s s 代替代替抽样成数pnppnsp)1 ( 重复抽样情况下抽样成数的平均误差计算重复抽样情况下抽样成数的平均误差计算不重复抽样情况下,抽样平均数的平均误差和抽样成数的不重复抽样情况下,抽样平均数的平均误差和抽样成数的平均误差计算平均误差计算设:全及总体单位数设:全及总体单位数 N 抽样总体单位数抽样总体单位数 n有:有:抽样总体单位数。总体单位数;全及总体标准差;式中抽样平均数的平均误差nNNnnx)1 (2没有全及总体标准差资没有全及总体标准差资料时,用抽样总体标准料时,用抽样总体标准差差 s s 代替代替)1 (2Nnnsx样本总体单位数。总体单位数;抽样成数;式中抽样成数平均

    9、误差nNpNnnppp)1 ()1 (抽样平均误差的计算不重复抽样重复抽样抽样成数平均误差抽样平均误差抽样形式nppp)1 ( nsx)1 (2Nnnsx)1 ()1 (Nnnppp%5Nn%5Nn应用条件全及总体标志变动程度全及总体标志变动程度 与抽样误差的大小成正比关系与抽样误差的大小成正比关系样本单位数样本单位数 与抽样误差的大小成反比关系与抽样误差的大小成反比关系抽样组织形式抽样组织形式 抽样组织形式不同,抽样误差的大小不同抽样组织形式不同,抽样误差的大小不同例6.1 某地对2800户农户年收入进行调查,抽取5%农户作样本,调查显示:1998年每人年平均收入为5965元,其年收入的标准

    10、差为104.80元,试计算重复抽样和不重复抽样的抽样平均误差。已知:已知:N=2800(户),n=28005%=140(户),s=104.80(元) 重复抽样的抽样平均数的抽样平均误差为:重复抽样的抽样平均数的抽样平均误差为: 不重复抽样的抽样平均数的抽样平均误差为:不重复抽样的抽样平均数的抽样平均误差为:)(86. 81408 .104元nsx)(63. 8)28001401 (1408 .104)1 (22元Nnnsx例6.2 某厂生产某产品,按正常生产检验产品中一级品率占60%。现从10 000件产品中抽取100件产品进行检验,试按重复和不重复抽样计算一级产品率的抽样成数的平均误差。已知

    11、:p=0.6,N=10 000 件,n=100 件重复抽样的抽样成数平均误差:重复抽样的抽样成数平均误差: 不重复抽样的抽样成数平均误差为:不重复抽样的抽样成数平均误差为:%9 . 41004 . 06 . 0)1 (nppp%88. 4)100001001 (1004 . 06 . 0)1 ()1 (Nnnppp 第四节第四节 全及指标的推断全及指标的推断 一、点估计和区间估计一、点估计和区间估计( (一一) )点估计点估计xXpP是是由由样样本本指指标标直直接接代代替替全全及及指指标标,不不考考虑虑任任何何抽抽样样误误差差因因素素。即即用用 直直接接代代表表 ,用用直直接接代代表表 。就就

    12、100 x 1002p 98%X 1002P 98% 在在全全部部产产品品中中,抽抽取取件件进进行行仔仔细细检检查查,得得到到平平均均重重量量克克,合合格格率率,我我们们直直接接推推断断全全部部产产品品的的平平均均重重量量克克,合合格格率率。例例(二)区间估计(二)区间估计 区间估计的含义 根据样本指标和抽样误差推断总体指标的可能范围,并说明估计总体指标的准确程度和可靠性。 - 抽样极限误差x、p抽样指标与全及指标之间抽样误差的可能范围。 - - - x x - X p p - P等价变换:ppxxpPpxXx说明说明:(1)式表示全及平均指标全及平均指标以抽样平均指标为中心, - -落在抽样

    13、平均指标x x 范围内;(1)(2) (2)式表示全及成数全及成数以抽样成数为中心,落在抽样成数 p p 范围内。例:某村5 000亩粮食耕地,用不重复抽样方法抽取50亩,求得其平均亩产为400公斤。若确定抽样极限误差为10公斤,请估计5000亩粮食耕地亩产。解:估计亩产(公斤)亩产(公斤)亩产4103901040010400 xxxXx例:从某品种农作物播种地块随机抽取秧苗1 000棵,其中死苗80棵。若确定抽样极限误差为3%,试估计该农作物秧苗的成活率区间。解:该农作物秧苗的成活率区间%95%89%31000801000%31000801000成活率成活率pppPp 区间推断的可靠程度区间

    14、推断的可靠程度( (置信度置信度) ) 令令 差的倍数)度(极限误差为平均误概率式中:则则自由tttttppppxxxxxxtxXtx则则 依据中心极限定律,当依据中心极限定律,当 n n3030,抽样平均指标近似服从,抽样平均指标近似服从正态分布正态分布,全及指标所落范围就可以用曲线所围成的面积大,全及指标所落范围就可以用曲线所围成的面积大小来计算。小来计算。 99.73%95.45% X-3 X-2 X- X X+ X+2 X+368.27%其中:概率度 t 与概率 F(t) 对应概率度 t 与概率 F(t) 的对应关系表(常用)概率度(t)概率F(t)概率度(t)概率F(t)0.671.

    15、001.501.96 2.000.50000.68270.86640.95000.95452.53.04.04.55.00.987600.997300.999400.999930.99999例6.3 某大学有500人进行高等数学统考,随机抽查20%,所得有关成绩数据如表。 试以95.45%的概率保证:(1)估计全部学生的平均成绩;(2)确定成绩在80分以上学生所占的比重和估计人数。 考试成绩分组组中值x各组人数占(%)f /f向下累计x f /f(x-x)2f /f 60分以下 60-70 70-80 80-90 90-1005565758595822402550.080.220.400.25

    16、0.051.000.920.700.300.054.4014.3030.0021.254.7531.047220.70000.066020.522520.6045合 计-1001.00-74.7098.9102 解:(1)由于 n/N=20%5% ,应采用不重复抽样公式计算平均误差:因 F(t)=95.45% ,即可得到:t=2)(945. 99102.98)()(70.74)(100%205002分分人ffxxffxxnx)(48.7692.7278. 17 .74)(78. 1)5001001 (100945. 92)1 (22分分xxxxXNnntt 由此说明有 95.45% 的概率估计

    17、全校学生的高等数学统考成绩平均在 72.9276.48 分之间。(2)设80分以上成绩 p = 0.3, t = 2%20.38%80.21%20. 8%30%20. 8%10. 42%10. 4)5001001 (100) 3 . 01 (3 . 0)1 ()1 (pppppPtNnnpp 估计80分以上人数为: NP=50021.8%=109(人),至 50038.20%=191(人)例6.4 某灯泡厂从一批灯泡中抽取100只进行使用寿命检查,测得其平均寿命为1250小时,标准差为240小时。若推断这批灯泡的使用寿命在11781322小时之间,其可靠程度有多大?解:通过上述计算可知其可靠程

    18、度为99.73%.%73.99)(, 324727211781250)(7213221250)(24100240tFtXxtnsxxxxx查表,(小时)或小时小时例6.5 某机械厂日产某零件8000只,现用随机不重复抽样方式,从中抽取400只进行质量检验,其中有20只不合格。如果要求推断全部零件的合格率在92.88%到97.12%之间,问其可靠程度有多大?解:抽样合格率为 p=1-20/400=95%45.95)(, 2%06. 1%12. 2%12. 288.92%95%12.97%95%06. 1)80004001 (400)95. 01 (95. 0)1 ()1 (tFtPptNnnpp

    19、ppppp查表,或通过上述计算可知其可靠程度为95.45%.被研究总体的标志变动程度被研究总体的标志变动程度样本指标对全及总体指标推断结样本指标对全及总体指标推断结果精确度高低果精确度高低抽样推断估计的可靠性大小抽样推断估计的可靠性大小nppttnttppxx)1 ( 、22222)1 (pxpptntn、例6.7 对某县农户进行经济收入调查,设已知农户平均年收入的标准差()为30元,要求可靠程度为95%,允许抽样误差为5元,问至少应抽多少农户进行调查。解:已知 = 30元,x= 5元,F(t) = 95%,t = 1.96户1393 .13853096. 1222222xtn例6.8 抽查一

    20、批某产品的合格率,设过去抽查的合格率为95%,现要求允许误差不超过1.5%,可靠程度为95.45%,问至少要抽查多少个产品。解:已知 p =0.95,p= 0.015, F(t) =95.45%,t = 2 )(8454 .844015. 005. 095. 02)1 (2222个ppptn)1 (2Nnnttxx)1 ()1 (Nnnpptp22222tNNtnx)1 ()1 (222pptNppNtnp例6.9 今对4000件出口产品进行质量抽样检验,按不重复随机抽样1/16的产品进行检查,发现有10件是废品,要求以95%概率保证,推断出这批产品废品率是否超过5%?如果要求抽样误差缩小到原

    21、来的1/2,概率不变,则应抽多少件产品?解:已知 N= 4000 件,n=40001/16=250 件,F(t) =95%, t = 1.96,废品率 p =10/250 =4%(1)%2 . 1)40002501 (250)04. 01 (04. 0)1 ()1 (NnnpppP = pp = ptp=4%1.961.2% = 4%2.35% =1.65% 6.23% 由计算知,这批产品的废品率会超过5%。(2)若将p 缩小到原来的1/2,p/2=2.35%/2=1.18% 件产品。应抽查件832)(83208.83196. 004. 096. 10118. 0400096. 004. 0400096. 1)1 ()1 (222222pptNppNtnp例6.10 对一批灯泡进行耐用时间检验,根据过去测定已知的标准差为40小时,合格率为95%,现要求使用寿命的允许误差不超过4小时,或合格率误差范围不超过2%,并以95.45%的概率度保证其可靠性,问两种方法(平均数、成数)各应抽查至少几只灯泡?解:已知 = 40小时,x= 4小时, p=95% p = 2%, F(t) =95.45%,t = 1(1)(2)只灯泡。只和别应抽查根据计算,两种方法分只只475400)(47502. 005. 095. 02)1 ()(40044022222222222pxpptntn

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第9讲大学统计学课件-抽样调查.ppt
    链接地址:https://www.163wenku.com/p-2603066.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库