第三章理论分布和抽样分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第三章理论分布和抽样分布课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 理论 分布 抽样 课件
- 资源描述:
-
1、第三章第三章 理论分布和抽样分布理论分布和抽样分布 第一节:概率及其计算第一节:概率及其计算 概率论:研究随机现象规律性的科概率论:研究随机现象规律性的科学。学。统计学:基于实际观测结果,利用统计学:基于实际观测结果,利用概率论得出的规律,解释偶然性概率论得出的规律,解释偶然性中所寄寓的必然性。中所寄寓的必然性。两者都是研究随机现象,概率论是两者都是研究随机现象,概率论是统计学的基础,统计学是概率论得统计学的基础,统计学是概率论得出规律在各领域中的实际应用。出规律在各领域中的实际应用。一、事件与概率一、事件与概率 事件是指某一事物的每一个现象,或事件是指某一事物的每一个现象,或某项试验的每一结
2、果。(试验中所发生某项试验的每一结果。(试验中所发生的现象)。的现象)。分类:分类:、必然事件:在一定条件组下,必、必然事件:在一定条件组下,必然要发生的事件。然要发生的事件。例:在标准大气压下,水加热到例:在标准大气压下,水加热到100这一组条件实现,这一组条件实现,则水沸腾是必则水沸腾是必然事件。然事件。、不可能事件:在一定条件组下,一、不可能事件:在一定条件组下,一定不能发生的事件。定不能发生的事件。例:在以上条件实现,水结冰这一事例:在以上条件实现,水结冰这一事件,就是不可能事件。件,就是不可能事件。、随机事件:在一定条件组实现下,、随机事件:在一定条件组实现下,可能发生也可能不发生的
3、事件。可能发生也可能不发生的事件。例:一粒种子播种后发芽与否。例:一粒种子播种后发芽与否。红花豌豆与白花豌豆杂交,红花豌豆与白花豌豆杂交,2是红是红花。花。概率的统计定义:概率的统计定义:假定在相似条件下,重复进行同一类假定在相似条件下,重复进行同一类试验,事件发生的次数试验,事件发生的次数a 与总试验次与总试验次数数n的比数称为频率的比数称为频率a/n,在试验总次数,在试验总次数n逐渐增大时,逐渐增大时,事件的频率愈来愈稳事件的频率愈来愈稳定地接近定值定地接近定值p,于是定义事件的概,于是定义事件的概率为率为p,并记为,并记为 P(A)=p一个总体的概率值在理论上是存在一个总体的概率值在理论
4、上是存在的,但在一般情况下,无法得到这的,但在一般情况下,无法得到这个数值,只有通过样本的频率来推个数值,只有通过样本的频率来推断总体概率。因此便以断总体概率。因此便以n在充分大时在充分大时事件的频率作为该事件概率事件的频率作为该事件概率p的近的近似值,即似值,即 (A)=p(a/n)概率的表示:概率的表示:小数小数分数分数0p(A)1 P(A)=1 时为必然事件时为必然事件 P(A)=0 时为不可能事件时为不可能事件二、事件间的关系二、事件间的关系基本事件基本事件:就是不可能再分的事就是不可能再分的事件。件。复合事件复合事件:由若干个基本事件组由若干个基本事件组合而成的事件。合而成的事件。以
5、以“事件事件”一词代表随机事件,并一词代表随机事件,并以字母以字母A,B,C.等表示,以等表示,以U表示表示必然事件,以必然事件,以V代表不可能事件。代表不可能事件。1.事件事件A与事件与事件B至少有一件发生至少有一件发生而构成的新事件称为事件而构成的新事件称为事件A与事件与事件B的的和事件和事件。记作:记作:A+B读作读作“或或A发生,或发生,或B发生发生”和事件可以推广到个事件:和事件可以推广到个事件:A+B+C+.+N表示表示N个事件至少有一个事件至少有一个发生。个发生。2.两个事件两个事件A与与B同时发生而构成的同时发生而构成的新事件称为事件新事件称为事件A与事件与事件B的的积事件积事
6、件。记作:记作:A.B,读作,读作“AB同时发生同时发生”积事件可以推广到多个事件的情形:积事件可以推广到多个事件的情形:A.B.C.N表示表示N个事件同时发生个事件同时发生。3.两个事件两个事件A与与B如果不能同时发生,即如果不能同时发生,即A.B=V,那么称,那么称A和和B是是互斥事件互斥事件。例:任一玉米株高例:任一玉米株高2.5m以上以上(A)任一玉米株高任一玉米株高2.0-2.5m(B)A.B:任一玉米株高既高于任一玉米株高既高于2.5m又在又在2.0-2.5m之间。之间。抛硬币:抛硬币:A:正面朝上:正面朝上B:反面朝上反面朝上 4.如果事件如果事件A与事件必发生其一,与事件必发生
7、其一,但又不可能同时发生,即:但又不可能同时发生,即:A+B=u,A.B=V,那么那么B是是A的的对立事件对立事件,可,可用表示。用表示。A 5.如果事件如果事件A1、A2.An两两互斥,两两互斥,且每次试验必发生其一,则称且每次试验必发生其一,则称A1、A2.An为为完全事件系完全事件系。例:袋中有红、黄、黑、白四种颜色的例:袋中有红、黄、黑、白四种颜色的球,每次取一个,球,每次取一个,“取到红球取到红球”、“取取到黄球到黄球”、“取到黑球取到黑球”、“取到白球取到白球”构成完全事件系。构成完全事件系。、如果事件的发生与否不影响事、如果事件的发生与否不影响事件的发生,则称其件的发生,则称其相
8、互独立相互独立。例:例:A:第一粒种子发芽第一粒种子发芽B:第二粒种子发芽第二粒种子发芽三、计算概率的法则三、计算概率的法则法则一法则一:对立事件的概率:对立事件的概率:若事件若事件A的概率为的概率为P(A),那么其对立事,那么其对立事件的概率为件的概率为 P()=1-P(A)例:小麦播种后发芽的概率为例:小麦播种后发芽的概率为0.9,那么,不发芽的概率为那么,不发芽的概率为(1-0.9)=0.1A法则二:法则二:互斥事件概率的加法:互斥事件概率的加法:若事件若事件A与事件与事件B是互斥的,概率是互斥的,概率各为各为P(A)和和P(B),那么,那么“A+B”事件事件的概率为的概率为 P(A+B
9、)=P(A)+P(B)法则三:独立事件概率的乘法:法则三:独立事件概率的乘法:若确定事件若确定事件A的概率时不受到事件的概率时不受到事件B的影响,反之亦然,那么,这两个的影响,反之亦然,那么,这两个事件是互相独立,称独立事件。对事件是互相独立,称独立事件。对于这类事件,同时出现这一新事件于这类事件,同时出现这一新事件的概率必为每个事件概率的积。的概率必为每个事件概率的积。P(A.B)=p(A).P(B)法则四:完全事件系的概率法则四:完全事件系的概率 若若A1,A2.An是完全事件系,是完全事件系,则这则这n个事件的概率之和为个事件的概率之和为1,即,即P(A1+A2+A3+.+An)=P(A
10、1)+P(A2)+.+P(An)=1如果如果n个事件出现的概率是相等的,个事件出现的概率是相等的,那么那么 P(Ai)=1/n第二节总体分布第二节总体分布一、二项分布一、二项分布(binomial distribution)(一)二项分布的概率函数(一)二项分布的概率函数二项总体:有非此即彼事件组成的总二项总体:有非此即彼事件组成的总体。体。二项分布:以容量二项分布:以容量n从二项总体中抽从二项总体中抽样样,共有共有n+1种可能的结果种可能的结果,每种结果都每种结果都有一个固定的概率有一个固定的概率,这种变量取值及其这种变量取值及其概率构成的分布称为二项分布概率构成的分布称为二项分布.种子发芽
11、试验:种子发芽试验:一粒种子:发芽概率一粒种子:发芽概率p、不发芽概率、不发芽概率q概率相加得概率相加得(p+q)两粒种子:两粒种子:甲乙均发芽:概率为甲乙均发芽:概率为p2 甲发乙不发:概率为甲发乙不发:概率为p(1-p)pq 乙发甲不发:乙发甲不发:qp 甲乙均不发:甲乙均不发:q2概率相加得概率相加得p2+pq+qp+q2=(p+q)2依此类推,独立地对依此类推,独立地对n粒种子进行实粒种子进行实验,一种结果出现验,一种结果出现x次的概率是:次的概率是:称为二项分布律或二项概率函数,称为二项分布律或二项概率函数,是是(p+q)n展开后含有展开后含有p(x)的一的一项这一分布律也称为贝努里
12、分项这一分布律也称为贝努里分布布其中,其中,x=0,1,2,n,为某为某事件出现次数。事件出现次数。n为样本含量为样本含量,即事件发生总数即事件发生总数.二项分布是说明结果只有两种二项分布是说明结果只有两种情况的情况的n次独立实验中发生某种次独立实验中发生某种结果为结果为x次的概率分布。次的概率分布。因为(因为(p+q),所以),所以二项分布的累积函数:二项分布的累积函数:二项分布中某结果最多发生二项分布中某结果最多发生k次的概率次的概率为发生为发生0次、次、1次、次、.、直至、直至k次的概率之和:次的概率之和:(二二)二项分布的应用条件二项分布的应用条件:(1)每次实验只有两类对立的结果每次
13、实验只有两类对立的结果;(2)n次事件相互独立;次事件相互独立;(3)每次实验某类结果的发生的概每次实验某类结果的发生的概率是一个常数。率是一个常数。(三)(三)二项分布的参数二项分布的参数二项分布总体的平均数和标准差为:二项分布总体的平均数和标准差为:二项分布常表示为:二项分布常表示为:B(n,p)即:二项分布是由即:二项分布是由n和和p两个参数据两个参数据定的。定的。(四四)二项分布的形状二项分布的形状二项分布的二项分布的形状形状有如下特征:有如下特征:(1)二项分布图形的形状取决于二项分布图形的形状取决于P 和和n 的大小;的大小;(2)当当P=0.5时,无论时,无论n的大小,均为的大小
14、,均为对称分布;对称分布;(3)当当p0.5,n较小时为偏态分布较小时为偏态分布,n较大时较大时逼近正态分布逼近正态分布。一般来说,当一般来说,当n大于,而大于,而p或或q又不过小(例如不接近于),又不过小(例如不接近于),且且np及及nq不小于时,可将其不小于时,可将其看作正态分布看作正态分布,可用正态公式求其可用正态公式求其概率。概率。(五)二项分布的应用实例(五)二项分布的应用实例、一批种子的发芽率为、一批种子的发芽率为0.8,现每,现每穴播粒,问每穴出三棵苗的概率?穴播粒,问每穴出三棵苗的概率?平均每穴出苗几棵?平均每穴出苗几棵?本例中,每穴出苗数为随机变本例中,每穴出苗数为随机变量量
15、X,它服从,它服从B(5,0.8),故:,故:若计算每穴出苗数低于若计算每穴出苗数低于4棵的概率,棵的概率,则计算累积概率:则计算累积概率:P(X3)=P(X=0)+P(X=1)+P(X=2)+P(X=3)平均每穴出苗数:平均每穴出苗数:=np=50.8=4、两个纯合亲本杂交、两个纯合亲本杂交(RRrr),F1自交,自交,F2的基因型分离比。的基因型分离比。F2中,中,R基因出现的概率基因出现的概率p=0.5,r基因出现的概率基因出现的概率q=0.5一对因子:一对因子:两对因子:两对因子:YYRRyyrrF2中显中显:显显:显显:显显:显显3、两对基因分离:、两对基因分离:bbRRBBrrF1
16、 BbRrF2 9B-R-:3B-rr:3bbR-:1bbrr问:样本容量多大时,才能以问:样本容量多大时,才能以99的概率至少得到一个的概率至少得到一个bbrr个体?个体?解:解:bbrr的概率的概率q=1/16,非非bbrr出现出现概率概率p=15/16。得到。得到bbrr的概率的概率99%,则非则非bbrr为,所以:为,所以:pn=(15/16)n=0.01n(lg15-lg16)=lg0.01n=71.4因此:要以的可能获得一个因此:要以的可能获得一个bbrr个体,样本容量只少为。个体,样本容量只少为。二、二、Poisson分布分布1.Poisson分布的概念分布的概念:二项分布二项分
17、布n很大而很大而P很小时的特殊形很小时的特殊形式。其概率函数式。其概率函数 x=0,1,2.n,其中,其中e为自然对数的底,为自然对数的底,为总体均数,为总体均数,x为事件发生的次数。为事件发生的次数。主要描述大量实验中随机稀疏主要描述大量实验中随机稀疏现象,如:单位面积内的昆虫现象,如:单位面积内的昆虫数、病斑数、植物种类、细胞数、病斑数、植物种类、细胞计数、田间杂草分布等。计数、田间杂草分布等。2.Poisson分布的应用条件分布的应用条件:(1)两类结果要相互对立;两类结果要相互对立;(2)n次试验相互独立;次试验相互独立;(3)n应很大应很大,P应很小。应很小。3.Poisson分布的
18、参数分布的参数方差与平均数相等,只有一个参方差与平均数相等,只有一个参数。数。4.Poisson分布的性质分布的性质:(1)均数与方差相等;均数与方差相等;(2)均数均数较小时呈偏态较小时呈偏态,20时近似时近似正态;正态;(3)n很大很大,p很小,很小,np=为常数时为常数时二项分布趋近于二项分布趋近于Poisson分布;分布;(4)n个独立的个独立的Poisson分布相加仍分布相加仍符合符合Poisson分布分布5、形状、形状由由决定:决定:很小时分布很偏,很小时分布很偏,增大后逐渐对称,趋近于正态分增大后逐渐对称,趋近于正态分布布 三、正态分布三、正态分布(normal distribu
19、tion)(一)正态分布的密度函数和分布函(一)正态分布的密度函数和分布函数数是连续性变数的一种理论分布。是连续性变数的一种理论分布。许多生物学产生的数据都服从正态分许多生物学产生的数据都服从正态分布。布。正态分布是生物统计学的重要基础正态分布是生物统计学的重要基础 对于平均数为对于平均数为,标准差为,标准差为的正态分的正态分布,其概率密度函数为:布,其概率密度函数为:-x 其中:其中:平均数,是曲线最高值的横坐标,平均数,是曲线最高值的横坐标,曲线以其为对称;曲线以其为对称;标准差,表示曲线展开程度,标准差,表示曲线展开程度,越越大,曲线展开度越大,数据越分散;大,曲线展开度越大,数据越分散
展开阅读全文