书签 分享 收藏 举报 版权申诉 / 42
上传文档赚钱

类型数据模型与决策-教学课件-作者-李连友-第4章-抽样分布与参数估计.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4312205
  • 上传时间:2022-11-28
  • 格式:PPTX
  • 页数:42
  • 大小:319.49KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《数据模型与决策-教学课件-作者-李连友-第4章-抽样分布与参数估计.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据模型 决策 教学 课件 作者 李连友 抽样 分布 参数估计
    资源描述:

    1、1一、一、抽样抽样及其原因及其原因2 抽样抽样就是为了进行抽样推断,根就是为了进行抽样推断,根据一定的原则和方法,从总体中抽取一部分据一定的原则和方法,从总体中抽取一部分个体(或单位)组成样本。个体(或单位)组成样本。广泛使用广泛使用抽样抽样的的原因原因:(1 1)抽样可以降低成本。)抽样可以降低成本。(2 2)抽样可以节约时间。)抽样可以节约时间。(3 3)对于一些具有破坏性的研究过程,只)对于一些具有破坏性的研究过程,只能使用抽样方法获取资料。能使用抽样方法获取资料。3 (4 4)在资源一定的条件下,抽样可以扩展研)在资源一定的条件下,抽样可以扩展研究内容,增强研究深度。究内容,增强研究深

    2、度。(5 5)当研究的总体为无限时,抽样是惟一的)当研究的总体为无限时,抽样是惟一的选择。选择。(6 6)当研究的总体很大,需要普查人员多,)当研究的总体很大,需要普查人员多,花费时间长时,根据抽样资料对总体的推断也许会花费时间长时,根据抽样资料对总体的推断也许会比普查更准确。比普查更准确。4二、二、抽样框抽样框5 抽取样本单位时所抽取样本单位时所依据依据的的目标总体目标总体清单清单、图或目录、图或目录等等三、三、有放回抽样有放回抽样与无放回抽样与无放回抽样6四、四、有限总体有限总体抽样和无限总体抽样和无限总体抽样抽样7 有限总体有限总体就是总体就是总体容量容量中所包含的中所包含的个体数量是有

    3、限个,或者说是可以计数的总个体数量是有限个,或者说是可以计数的总体。体。无限无限总体总体就是总体就是总体容量容量中所包含中所包含的个体数量是无限个,或者无法计数的总体。的个体数量是无限个,或者无法计数的总体。五、五、随机抽样随机抽样与非随机抽样与非随机抽样8 随机抽样随机抽样也称也称概率抽样概率抽样,就是严格按随,就是严格按随机原则,即保证总体中每个单位都有同等机会被抽机原则,即保证总体中每个单位都有同等机会被抽中的原则抽取样本单位的抽样组织方式。中的原则抽取样本单位的抽样组织方式。常用常用的随机抽样方法主要有简单随机抽的随机抽样方法主要有简单随机抽样、分层抽样、系统抽样、整群抽样和多阶段抽样

    4、、分层抽样、系统抽样、整群抽样和多阶段抽样等。样等。非非随机抽样随机抽样也称也称非概率抽样非概率抽样,是指抽样时不,是指抽样时不是遵循随机原则,而是按照研究人员的主观经验或其是遵循随机原则,而是按照研究人员的主观经验或其它条件来抽取样本单位,总体中每个单位被选作样本它条件来抽取样本单位,总体中每个单位被选作样本单位的概率不一定相同的一种抽样方式。单位的概率不一定相同的一种抽样方式。9 常用常用的非随机抽样有方便抽样、滚雪的非随机抽样有方便抽样、滚雪球抽样、判断抽样和定额抽样等。球抽样、判断抽样和定额抽样等。六、抽样误差六、抽样误差(一)抽样误差的概念(一)抽样误差的概念 抽样抽样误差误差是样本

    5、统计量的值与总体被估计参是样本统计量的值与总体被估计参数之间的差数之间的差。(二)产生误差的原因(二)产生误差的原因10一、一、随机抽样随机抽样(一)简单随机抽样(一)简单随机抽样 简单随机抽样简单随机抽样也称也称单纯随机抽样单纯随机抽样、纯随机抽纯随机抽样样,是指从总体,是指从总体 个单位中随机抽取个单位中随机抽取 个单位作为样本,个单位作为样本,使每个单位被抽中的概率相等的一种抽样方式。使每个单位被抽中的概率相等的一种抽样方式。11简单抽样的方法:简单抽样的方法:(1 1)抽签法)抽签法(2 2)随机数表法)随机数表法12(二)(二)分层分层随机抽样随机抽样 分层分层随机抽样随机抽样的基本

    6、原理是,首先,将总体的基本原理是,首先,将总体中的所有个体分成若干组(这些组通常称为中的所有个体分成若干组(这些组通常称为“层层”););其次,再从每一层中抽取一个简单随机样本;最后,其次,再从每一层中抽取一个简单随机样本;最后,将每一层简单随机样本合成为一个样本的抽样方式将每一层简单随机样本合成为一个样本的抽样方式。13 分层分层随机抽样的应用价值取决于层内个体随机抽样的应用价值取决于层内个体的同质性的同质性。抽样抽样误差的大小主要取决于层内各个体误差的大小主要取决于层内各个体之间的差异性之间的差异性。抽样方法:抽样方法:(1 1)等比例抽样)等比例抽样 (2 2)不)不等比例抽样等比例抽样

    7、14(三)整群抽样(三)整群抽样 整群抽样整群抽样是指,首先要求将总体分成若干个是指,首先要求将总体分成若干个不同的组(这些组通常称为不同的组(这些组通常称为“群群”);其次,再从这);其次,再从这些不同的群中抽取一部分群组成一个简单随机样本的些不同的群中抽取一部分群组成一个简单随机样本的抽样方式。抽样方式。15 整群抽样整群抽样的应用价值取决于群内个体的差异的应用价值取决于群内个体的差异性性。抽样抽样误差的大小主要取决于各个群之间的差误差的大小主要取决于各个群之间的差异性异性。整群抽样整群抽样的两个突出优点是方便和成本低的两个突出优点是方便和成本低。【思考思考】分层抽样与整群抽样的联系和区别

    8、。分层抽样与整群抽样的联系和区别。16(四)系统抽样(四)系统抽样 系统抽样系统抽样也称为也称为等距抽样等距抽样或或机械抽样机械抽样,是将,是将总体中所有个体先按某种标志排队,然后再按相同的总体中所有个体先按某种标志排队,然后再按相同的间隔抽取间隔抽取 个个体组成一个样本的抽样个个体组成一个样本的抽样。排队标志的选择排队标志的选择 具体样本单位的抽取方法具体样本单位的抽取方法17二、二、非随机抽样非随机抽样(一)(一)方便方便抽样抽样 方便方便抽样抽样就是研究者依据抽选的方便程度来就是研究者依据抽选的方便程度来确定样本单位的一种抽样技术。确定样本单位的一种抽样技术。18(二)(二)滚雪球抽样滚

    9、雪球抽样 滚雪球滚雪球抽样抽样的原理是,首先确定一个或一批受访的原理是,首先确定一个或一批受访对象,然后再由这些受访对象推荐另外一些受访对象,这对象,然后再由这些受访对象推荐另外一些受访对象,这样像滚雪球一样一轮一轮地推荐,样本容量不断增大,直样像滚雪球一样一轮一轮地推荐,样本容量不断增大,直至达到要求为止至达到要求为止。滚雪球抽样的原理是,首先确定一个或滚雪球抽样的原理是,首先确定一个或一批受访对象,然后再由这些受访对象推荐另外一些受访一批受访对象,然后再由这些受访对象推荐另外一些受访对象,这样像滚雪球一样一轮一轮地推荐,样本容量不断对象,这样像滚雪球一样一轮一轮地推荐,样本容量不断增大,直

    10、至达到要求为止。增大,直至达到要求为止。19(三)(三)判断判断抽样抽样 判断判断抽样抽样是研究者根据个人的判断,选择他是研究者根据个人的判断,选择他(她)认为所选择的能够代表总体的个体组成样本的(她)认为所选择的能够代表总体的个体组成样本的一种抽样方法。一种抽样方法。20(四)(四)典型抽样典型抽样 典型典型抽样抽样也称为也称为典型调查典型调查,是研究者在对所,是研究者在对所研究总体全面分析基础上,有意识地从中抽选一部分研究总体全面分析基础上,有意识地从中抽选一部分具有典型性的个体组成样本,并进行进一步研究的一具有典型性的个体组成样本,并进行进一步研究的一种抽样方式种抽样方式。选择典型单位的

    11、方法选择典型单位的方法21(五)(五)重点抽样重点抽样 重点重点抽样抽样也称为也称为重点调查重点调查,是研究者从总体,是研究者从总体中只抽选一部分重点个体组成样本的抽样方式中只抽选一部分重点个体组成样本的抽样方式。重点单位的含义重点单位的含义 重点抽样的目的重点抽样的目的22 样本样本统计量所有可能值构成的概率分布称为统计量所有可能值构成的概率分布称为抽样分布抽样分布。【注意注意】样本统计量和样本统计量的值的区别样本统计量和样本统计量的值的区别23一、一、样本均值(样本均值()的抽样分布)的抽样分布(一)(一)样本均值抽样分布样本均值抽样分布的的含义含义 样本均值(样本均值()抽样分布)抽样分

    12、布就是样本均就是样本均值(值()所有可能取值的概率分布)所有可能取值的概率分布。*样本均值样本均值的分布特征依赖于总体的分布特征依赖于总体的分布类型。的分布类型。241.1.总体分布总体分布已知且为已知且为正态分布正态分布 当当总体是正态概率分布时,无论样本容量总体是正态概率分布时,无论样本容量为多少,为多少,的抽样分布一定是正态概率分布的抽样分布一定是正态概率分布。2.2.总体分布总体分布未知未知 借助于借助于统计学中的中心极限定理来确定统计学中的中心极限定理来确定 样本均值的样本均值的抽样分布抽样分布。25 中心极限定理中心极限定理的基本的基本含义含义:当当样本容量足够大(样本容量足够大(

    13、)时,不论总体分布)时,不论总体分布的类型如何,从总体中抽取的简单随机样本的的类型如何,从总体中抽取的简单随机样本的 的抽样的抽样分布都可以近似地看成正态概率分布。分布都可以近似地看成正态概率分布。26(二)样本均值的样本均值的期望值和抽样分布的期望值和抽样分布的标准差标准差27 xxEmxx2样本均值有放回抽样的抽样样本均值有放回抽样的抽样标准误差标准误差28nx1NnNnx样本均值有放回抽样的抽样标准误差样本均值有放回抽样的抽样标准误差二、二、样本样本比例比例 的抽样分布的抽样分布29nnp1(一)样本比例抽样分布的含义(一)样本比例抽样分布的含义样本比例样本比例 所有可能取值的概率分布。

    14、所有可能取值的概率分布。(二)样本比例的期望值和标准差(二)样本比例的期望值和标准差30nPPp1 PppE11NnNnPPp两种标准差公式通用的条件:两种标准差公式通用的条件:05.0Nnf一、点估计的含义一、点估计的含义31 用用样本统计量一个特定的值(一个点)样本统计量一个特定的值(一个点)作为相应总体参数的估计值。作为相应总体参数的估计值。二、点估计的标准二、点估计的标准(一)无偏性(一)无偏性(二)有效性(二)有效性(三)一致性(三)一致性32一、区间估计的基本问题一、区间估计的基本问题(一)(一)区间估计的区间估计的含义含义(二)几组重要概念(二)几组重要概念1.1.区间区间 置信

    15、上限置信上限 置信下限置信下限2.2.置信系数置信系数 置信水平置信水平3.3.估计风险估计风险4.4.误差边际(边际误差、允许误差、抽样极限误差)误差边际(边际误差、允许误差、抽样极限误差)33二、二、总体均值总体均值的的区间估计区间估计(一)(一)单个总体均值的单个总体均值的区间估计区间估计1.1.大样本情形下大样本情形下总体均值总体均值的区间估计的区间估计(1 1)总体标准差已知:)总体标准差已知:34nzxnzx22 例如例如,在先在先科计算机公司的例子中,假定根科计算机公司的例子中,假定根据历史资料据历史资料得知得知:30003000名员工年均收入的标准差为名员工年均收入的标准差为3

    16、9003900元元。35在本次抽样中:在本次抽样中:30n33.56883x96.195.012z30003000名员工年均收入区间估计为:名员工年均收入区间估计为:93.5827873.5548730390096.133.5688330390096.133.5688322nzxnzx 计算计算结果表明,在已知总体标准差为结果表明,在已知总体标准差为39003900元,元,样本容量为样本容量为3030个人,置信水平为个人,置信水平为95%95%的情况下,先科计的情况下,先科计算机公司算机公司30003000名员工的年均收入大约在名员工的年均收入大约在55487.7358278.9355487.

    17、7358278.93元之间。元之间。36(2 2)总体总体标准差未知标准差未知:37nszxnszx222.2.小样本总体标准差未知时总体均值的区间估计小样本总体标准差未知时总体均值的区间估计38nstxnstx222/t1nt2/t:在自由度为 分布右侧尾部面积为 时的 值。例题见教材102页。(二)两个总体均值之差的区间估计(二)两个总体均值之差的区间估计1.1.大样本情况下大样本情况下,两个两个总体方差总体方差 已知时已知时,它们之间,它们之间均值之差均值之差的的区间估计区间估计 392221212/21212221212/21nnzxxnnzxx2.2.大大样本情况下样本情况下,两个两

    18、个总体方差总体方差 未知未知时时,它们之间均它们之间均值之差值之差的的区间估计区间估计402221212/21212221212/21nsnszxxnsnszxx 例如例如,北京一家大型百货公司在市中心经营长达,北京一家大型百货公司在市中心经营长达5555年后,年后,于于20102010年年1212月在北京远郊开了第一家连锁店。该公司的销售部门月在北京远郊开了第一家连锁店。该公司的销售部门经理已经注意到,在某一商店畅销的商品在另一商店不一定总是经理已经注意到,在某一商店畅销的商品在另一商店不一定总是同样地畅销。这位经理经过分析认为,发生这种情况的原因有可同样地畅销。这位经理经过分析认为,发生这

    19、种情况的原因有可能在于,两个地区的顾客包括在年龄、性别、教育程度、收入等能在于,两个地区的顾客包括在年龄、性别、教育程度、收入等方面存在着差异。于是,该部门经理邀请一家市场调查咨询机构方面存在着差异。于是,该部门经理邀请一家市场调查咨询机构对两个地区顾客在上述几方面的差异进行了调查。对两个地区顾客在上述几方面的差异进行了调查。其中其中,有关两地区顾客年龄差异方面的调查,调查机构,有关两地区顾客年龄差异方面的调查,调查机构设计的方案如下:设计的方案如下:41 :代表总体代表总体1 1,指所有光顾市中心商店的顾客;,指所有光顾市中心商店的顾客;:代表总体代表总体2 2,指所有光顾远郊商店的顾客;,指所有光顾远郊商店的顾客;:代表总体代表总体1 1的均值,即所有光顾市中心商店顾客的平均年的均值,即所有光顾市中心商店顾客的平均年龄;龄;:代表总体代表总体2 2的均值,即所有光顾远郊商店顾客的平均年龄;的均值,即所有光顾远郊商店顾客的平均年龄;():代表两个总体均值的差异;):代表两个总体均值的差异;42

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:数据模型与决策-教学课件-作者-李连友-第4章-抽样分布与参数估计.pptx
    链接地址:https://www.163wenku.com/p-4312205.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库