概率分布与抽样.课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《概率分布与抽样.课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 分布 抽样 课件
- 资源描述:
-
1、2022-5-311第四章第四章 概率分布与抽样概率分布与抽样 从这一章开始便进入推断统计学的内容,它会节从这一章开始便进入推断统计学的内容,它会节省人们的时间和财物最佳限度地认识研究对象。省人们的时间和财物最佳限度地认识研究对象。 现实世界包含的素材集合非常庞大,从中提取需现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:要的信息非常困难。如:选民人数:每个候选人的支持率是多少?选民人数:每个候选人的支持率是多少?产品:不合格率是多少?产品:不合格率是多少?环境:污染程度如何?环境:污染程度如何?市场:品种、价格、质量、购买力等情况的了解。市场:品种、价格、质量、购买力等情况的
2、了解。 在这一章里,你将会了解到样本是怎样抽取的,在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。体参数做估计。2022-5-312主要内容主要内容 4.1 抽样的一般问题抽样的一般问题4.2 三种不同性质的分布三种不同性质的分布4.3 一个总体参数推断时样本统计量一个总体参数推断时样本统计量 的抽样分布的抽样分布4.4 两个总体参数推断时样本统计量两个总体参数推断时样本统计量 的抽样分布的抽样分布4.5 其他抽样方法其他抽样方法2022-5-3134.1 抽样的一般问题抽样的一般问题w4.1.
3、1 一个例子一个例子w4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念w4.1.3 简单随机抽样简单随机抽样2022-5-3144.1.1 一个例子一个例子 本例中存栏肉猪本例中存栏肉猪1000010000头组成的集合,则称为头组成的集合,则称为总体总体,它是指,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。一般总体的单位总数用了研究目标时,它具有惟一性。一般总体的单位总数用N N表示,表示,称作称作总体容量总体容量。本例中所抽出的。本例中所抽出的100100头肉猪组成的集合,则称为头肉猪组
4、成的集合,则称为样本样本,它是指在统计抽样中按照,它是指在统计抽样中按照“随机原则随机原则” ” 从总体从总体N(10000)N(10000)中抽出的部分单位中抽出的部分单位( (每个单位称作样本单位每个单位称作样本单位) )所组成的整体,又所组成的整体,又称子样。一般样本的单位总数用称子样。一般样本的单位总数用n(100)n(100)表示,称作表示,称作样本容量样本容量。样本不具惟一性,它的可能个数与样本不具惟一性,它的可能个数与N N、n n及抽样方法有关。通常及抽样方法有关。通常n30n30称为称为小样本小样本,n30n30称为称为大样本大样本,在抽样调查中取大或小样,在抽样调查中取大或
5、小样本会直接影响到抽样分布的特征。本会直接影响到抽样分布的特征。例例 某养猪厂共有存栏肉猪某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均头,现欲了解这批肉猪平均每头毛重每头毛重(设为设为 ),如果将每头肉猪过称去获取数据将是不合,如果将每头肉猪过称去获取数据将是不合算的。我们可以按照算的。我们可以按照“随机原则随机原则” 从中抽出从中抽出100头称重量,计头称重量,计算这算这100头的平均每头毛重,以达到我们期望的目的。头的平均每头毛重,以达到我们期望的目的。2022-5-3151、总体和样本、总体和样本 总体:研究对象全体,又称母体。容量用总体:研究对象全体,又称母体。容量用N表示。
6、表示。 具备惟一性。具备惟一性。样本:按随机原则从总体中抽出的部分单位的全体,样本:按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。样本容量用被抽出的每个单位称样本单位。样本容量用n表示。表示。样本不具惟一性。样本不具惟一性。 当当n30时,为小样本。时,为小样本。当当n30时,为大样本。时,为大样本。4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念2022-5-3162、总体参数和样本统计量、总体参数和样本统计量 根据全及总体各单位变量值计算的反映全及总体根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,故称总某数量特征的综合指标,
7、由于总体唯一确定,故称总体参数。体参数。 如上例中的如上例中的 根据样本各单位变量值计算的反映样本某方面数根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故称为样量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。本统计量,它是一个随机变量。 如上例中的抽出如上例中的抽出100头肉猪的平均每头毛重头肉猪的平均每头毛重4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念2022-5-3173、重复抽样与不重复抽样、重复抽样与不重复抽样从总体中抽取样本有两种方法:重复抽样和不重复抽样。从总体中抽取样本有两种方法:重复抽样和不重复抽样。重复抽
8、样重复抽样,抽样安排,抽样安排-对每次被抽到的单位经登记后再放回对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。立的试验。不重复抽样不重复抽样,抽样安排,抽样安排-对被抽到的单位登记后不再放回总对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响件是不同的,前一次
9、的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。统计中称这样的抽样为相互不独立的试验。4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念2022-5-3184.1.3 简单随机抽样简单随机抽样 简单随机抽样也称为简单随机抽样也称为纯随机抽样纯随机抽样。它是对总体单位。它是对总体单位不做任何分类或排队,直接从总体中按不做任何分类或排队,直接从总体中按“随机原则随机原则”抽抽取样本单位的调查方式。取样本单位的调查方式。 为了便于抽取样本单位,一般在明确抽样框的条为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然后用抽签式或件下,对总体的每个
10、单位都要编号,然后用抽签式或利用利用随机数字表随机数字表进行抽取。进行抽取。 例如:例如:N=500 n=10 编码从编码从1-500号号 在随机数表中随意选取二个数字,假如得到在随机数表中随意选取二个数字,假如得到4行,行,43列。则选取的号码从这个被选中的数开始,由于列。则选取的号码从这个被选中的数开始,由于500是是个三位数,则小于个三位数,则小于500的连续三位数即为中选号码,见的连续三位数即为中选号码,见表中所示。表中所示。2022-5-3194.1.3 简单随机抽样简单随机抽样2022-5-31104.2 三种不同性质的分布三种不同性质的分布4.2.1 几种常见分布几种常见分布4.
11、2.2 总体分布总体分布4.2.3 样本分布样本分布4.2.4 抽样分布抽样分布4.2.5 样本推断总体的理论依据样本推断总体的理论依据这些内容与前面内这些内容与前面内容有什么关系容有什么关系?2022-5-3111一、随机变量的概率分布一、随机变量的概率分布(一)概率分布的含义(一)概率分布的含义w 1、在随机试验中,若、在随机试验中,若X随着试验结果的不同而随着试验结果的不同而随机地取各种不同的数值,并且对取每一个数随机地取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率,则称值或某一范围内的值都有相应的概率,则称X为一个为一个随机变量随机变量,按其取值特点可分为,按其取值
12、特点可分为离散型离散型随机变量随机变量和和连续型随机变量连续型随机变量。w 2、随机变量在其取值范围内,取值与取值概率、随机变量在其取值范围内,取值与取值概率间一一对应的关系间一一对应的关系,称为随机变量的,称为随机变量的概率分布概率分布(probability distribution(probability distribution,简称,简称分布分布) )。w 3、概率分布可以用各种图表来表示,一些也可、概率分布可以用各种图表来表示,一些也可以用公式来表示。以用公式来表示。意义意义:描述随机变量变化的:描述随机变量变化的统计规律;方便地计算某一事件发生的概率。统计规律;方便地计算某一事件
13、发生的概率。4.2.1 几种常见分布几种常见分布2022-5-3112(二)(二) 离散型随机变量的概率分布离散型随机变量的概率分布 n离散型随机变量概率分布的两种表现形式离散型随机变量概率分布的两种表现形式n1.分布列(律)分布列(律)n2.概率函数概率函数 2022-5-3113 概率函数概率函数p(xi)的数学性质的数学性质2022-5-3114(三)(三) 连续型随机变量的概率分布连续型随机变量的概率分布(1/3) n1. 连续型随机变量的表现方式密度函数连续型随机变量的表现方式密度函数 ( )f x2022-5-3115(三)(三) 连续型随机变量的概率分布连续型随机变量的概率分布(
14、2/3)n2.密度函数密度函数 的数学性质的数学性质n3.事件事件“ ”发生的概率发生的概率 的计算方法的计算方法( )f xaXb()( )baP aXbf x dx=2022-5-3116(三)(三) 连续型随机变量的概率分布连续型随机变量的概率分布(3/3)n4.事件事件“ ”发生的概率的几何意义发生的概率的几何意义n5.连续型随机变量的期望值和方差分别为连续型随机变量的期望值和方差分别为 aXb2022-5-3117(四)(四) 随机变量的分布函数随机变量的分布函数 n1.分布函数的来源分布函数的来源 如前所述,离散型随机变量的分布用概率函数来描述,连续型如前所述,离散型随机变量的分布
15、用概率函数来描述,连续型随机变量的分布用密度函数来描述,两者形式不同,表现各异。随机变量的分布用密度函数来描述,两者形式不同,表现各异。为了更方便地表现随机变量的分布,下面引入分布函数。为了更方便地表现随机变量的分布,下面引入分布函数。 n2.分布函数的定义分布函数的定义2022-5-31183.分布函数的几何意义及数学性质分布函数的几何意义及数学性质n1)几何意义几何意义n2)数学性质数学性质2022-5-31194.随机变量分布函数的具体表现随机变量分布函数的具体表现2022-5-3120二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布w 1.定义定义2022-5-3121w
16、正态分布的密度函数正态分布的密度函数图形图形是一条以均值为中心是一条以均值为中心的对称钟型曲线的对称钟型曲线 二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-3122w 2.正态分布密度函数正态分布密度函数 的数学性质的数学性质 ( )f x二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-3123w 3.标准正态分布及其重要意义标准正态分布及其重要意义二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-3124w 4.标准化法标准化法二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-3125w 标
17、准化法的标准化法的几何意义几何意义 w 标准化变换实质上是作了一个坐标轴的平移和标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布的平均数尺度变换,使正态分布的平均数 ,标准,标准差差 。 0m=1s=二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-3126w 5.正态分布表及上侧分位数正态分布表及上侧分位数二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-3127w 6. 准则准则 3s二、正态分布二、正态分布4.2.1 几种常见分布几种常见分布2022-5-31283s准则示意图准则示意图二、正态分布二、正态分布4.2.1 几种常
18、见分布几种常见分布2022-5-3129w 7.正态分布的重要意义正态分布的重要意义 在随机理论中,正态分布是最重要的一种分布在随机理论中,正态分布是最重要的一种分布,理由如下:理由如下:w 它是最常见的一种分布,现实中许多随机变它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。量服从或近似服从正态分布。w 在一定的条件下,正态分布是其他分布的近在一定的条件下,正态分布是其他分布的近似分布。似分布。w 许多有用的分布,特别是小样本的精确分布许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。是由正态分布推导出来的。二、正态分布二、正态分布4.2.1 几种常见分布几种常见
19、分布2022-5-3130三、小样本三、小样本(n30)的精确分布的精确分布w1、2分布w2、t分布w3、F分布4.2.1 几种常见分布几种常见分布2022-5-31311、 2分布分布( 2 distribution) (1)推导说明推导说明由阿贝由阿贝(Abbe) 于于1863年首先给出,后来由海尔墨特年首先给出,后来由海尔墨特(Hermert)和卡和卡皮尔逊皮尔逊(KPearson)分别于分别于1875年和年和1900年推导出来。年推导出来。设设 ,则,则构造构造 ,则,则 Yi 服从自由度为服从自由度为1的的 2分分布,即布,即当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则
20、的样本,则4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-31321、 2分布分布(2)性质和特点性质和特点由于由于 2 分布变量为正态变量的平方和,故分布变量为正态变量的平方和,故分布的变量值分布的变量值始终为正。始终为正。可加性:若可加性:若U和和V为两个独立的服从为两个独立的服从 2分布的随机变量,分布的随机变量,U 2(n1),V 2(n2),则则U+V这一随机变量服从自由度为这一随机变量服从自由度为n1+n2的的 2分布。分布。 n个独立正态变量平方和称为有个独立正态变量平方和称为有n个自由度的个自由度的 2-分布分布,记为记为
21、2(n)。 2-分布为一族分布分布为一族分布, 成员由自由度区分。成员由自由度区分。 分布的形状取决于其自由度分布的形状取决于其自由度n的大小,通常为不对称的正的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称。偏分布,但随着自由度的增大逐渐趋于对称。 期望为期望为E( 2)=n,方差为,方差为D( 2)=2n(n为自由度为自由度) 4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-31331 1、 2分布分布(3)图示)图示 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2
22、 = (n-1)s2/2计算出所有的计算出所有的 2值值总体总体4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-31341 1、 2分布分布(4) 2分布的分布的上上 分位点分位点 分位点分位点 设设X 2(n),若对于,若对于 :0 1, 存在存在2( )0n, 满足满足2( ),P Xn则称则称2( )n为为2( )n分布的分布的上上 分位点。分位点。2( )n4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-3135 由统计学家哥赛特(由统计学家哥赛特(W.S.Gosset)于)于1
23、908年提出,并以其笔名命名。年提出,并以其笔名命名。2 2、t-分布分布(t-distribution) (1)t分布的构造及性质分布的构造及性质4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布 若若 N(0, 1), 2(n), 与与 独立,则独立,则( )./Tt nn 221lim( )( ),2tnf ttex 2022-5-3136t(n)(n)分布的图形为分布的图形为2 2、t-分布分布(t-distribution) (2)t分布的图示分布的图示4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(nt0.05)=0.05P(tt0
24、.05)=1-=0.95w 对于给定的对于给定的 :0 t )= 的点的点t 为为t(n)分布的上分布的上 分位点分位点。)(1nt)(nt2 2、t-分布分布(t-distribution) (3)t分布的上分布的上 分位点分位点4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-3138由统计学家费希尔由统计学家费希尔(R.A.Fisher) 提出的,以其姓提出的,以其姓氏的第一个字母来命名氏的第一个字母来命名构造:设若构造:设若U为服从自由度为为服从自由度为n1的的 2分布,即分布,即U 2(n1),V为服从自由度为为服从自由度为n2的的
25、 2分布,即分布,即V 2(n2),且,且U和和V相互独立,则相互独立,则 称称F为服从自由度为服从自由度n1和和n2的的F分布,记为分布,记为3 3、F分布分布(F distribution) (1)F分布的构造分布的构造4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-3139F分布(图示)3 3、F分布分布(F distribution) (2)F分布的图示分布的图示4.2.1 几种常见分布几种常见分布 三、三、小样本小样本(n30)的精确分布的精确分布2022-5-3140w F分布的分位点分布的分位点:w 对于对于 :0 1, 若满
展开阅读全文