生物统计2章-概率和概率分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计2章-概率和概率分布课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计 概率 分布 课件
- 资源描述:
-
1、2022-5-31第二章第二章 概率和概率分布概率和概率分布2.1 2.1 概率的基本概念概率的基本概念2.2 2.2 概率分布概率分布2.3 2.3 总体特征数总体特征数2.4 2.4 几种常见的概率分布律几种常见的概率分布律2022-5-31第二章第二章 概率和概率分布概率和概率分布2.1 2.1 概率的基本概念概率的基本概念 自然现象:自然现象:确定性现象确定性现象和和非确定性现象非确定性现象(随机现象)(随机现象) 从随机现象中做大量的研究,能从其偶然从随机现象中做大量的研究,能从其偶然性中揭示内在的规律性中揭示内在的规律 统计学所研究的是统计学所研究的是非确定性现象,非确定性现象,2
2、022-5-31概率的统计定义是在大量的试验中,以频率的稳概率的统计定义是在大量的试验中,以频率的稳定性为基础上提出来的。设定性为基础上提出来的。设k次随机试验,成功事次随机试验,成功事件件A A 出现出现l次,则称次,则称l/ /k是是K K次随机试验中成功的频次随机试验中成功的频率率。频率是由样本数据计算得到的。由于样本分。频率是由样本数据计算得到的。由于样本分布的不恒定性,不同的随机试验,事件布的不恒定性,不同的随机试验,事件A A的出现频的出现频率也不同,随着率也不同,随着K K改变,频率也有一定的波动。改变,频率也有一定的波动。随着随着K K的增大,频率的增大,频率l/ /k将围绕着
3、某一确定的常数将围绕着某一确定的常数P P做平均幅度愈来愈小的变动,这就是所谓频率的做平均幅度愈来愈小的变动,这就是所谓频率的稳定性,其中稳定性,其中P P即为事件即为事件A A的概率。简单的说的概率。简单的说概率概率就是频率的稳定值就是频率的稳定值。在试验次数较多时,可以用。在试验次数较多时,可以用频率作为概率的近似值。频率作为概率的近似值。 ( (P23 P23 表表2-1)2-1)2.1.1 2.1.1 概率的统计定义概率的统计定义2022-5-31 概率是事件在试验结果中出现可能性大概率是事件在试验结果中出现可能性大小的定量计算,是事件固有的属性,有小的定量计算,是事件固有的属性,有以
4、下明显的性质:以下明显的性质:任何事件任何事件A A的概率均满足:的概率均满足:0P0P(A A)1 1必然事件必然事件W W的概率为的概率为1 1,即,即P P(W W)=1=1不可能事件(不可能事件(V V)的概率为)的概率为0 0,即,即P P(V V)=0=02.1.2.1.1 1 概率的统计定义(续)概率的统计定义(续)2022-5-31 概率的统计定义是在大量的试验中,以频概率的统计定义是在大量的试验中,以频率的稳定性为基础上提出来的。不需要做率的稳定性为基础上提出来的。不需要做试验就可以确定事件出现的概率,称为古试验就可以确定事件出现的概率,称为古典概率,具有以下特点:典概率,具
5、有以下特点: 随机试验的随机试验的全部可能结果全部可能结果(基本事件数)(基本事件数)是有限的是有限的; 各基本事件间是各基本事件间是互不相容且等可能的互不相容且等可能的。 缺点:要求各基本事件是缺点:要求各基本事件是等概率且有限等概率且有限的。的。2.1.2 2.1.2 概率的古典定义概率的古典定义2022-5-31随机变量随机变量 随机变量就是在随机试验中被测定的量,随机变量就是在随机试验中被测定的量,所取得的值称为观察值。可分为所取得的值称为观察值。可分为离散型随离散型随机变量和连续型随机变量机变量和连续型随机变量。 离散型随机变量:可能取得的数值为离散型随机变量:可能取得的数值为有限有
6、限个或可数无穷个孤立的数值个或可数无穷个孤立的数值。 连续型随机变量:连续型随机变量:可取某一可取某一(有限或无限)(有限或无限)区间内的任何数值区间内的任何数值。2.2 2.2 概率分布概率分布2022-5-31将随机变量将随机变量X X所取得值所取得值x x的概率的概率P(X=xX=x)写)写成成x x的函数的函数p(x)(x),称为随机变量,称为随机变量X X的的概率概率函数公式为函数公式为p(x)=(x)=P(X=x)(X=x)。 概率函数应满足:概率函数应满足: p(x)(x) 0 0 p(x)=1(x)=12.2.12.2.1离散型随机变量的概率分布离散型随机变量的概率分布2022
7、-5-31 将将X X的一切可能值的一切可能值x x1 1,x x2 2,x x3 3,x xn n,以,以及取得这些值的概率及取得这些值的概率P(x x1 1),), P(x x2 2),),. ,p(x xn n),),.排列起来,构成了排列起来,构成了离散型离散型随机变量的概率分布随机变量的概率分布。常用概率分布表或概率。常用概率分布表或概率分布图表示。分布图表示。 2.2.1 2.2.1 离散型随机变量的概率分布(续)离散型随机变量的概率分布(续)离散型随机变量的概率分布表离散型随机变量的概率分布表x1x2xnp(x1)p(x2)p(xn)2022-5-31离散型随机变量的概率分布图离
8、散型随机变量的概率分布图2022-5-31离散型变量概率的分布函数:离散型变量概离散型变量概率的分布函数:离散型变量概率的累积。其公式为率的累积。其公式为0)()()(00 xxiixXPxpxF2.2.1 2.2.1 离散型随机变量的概率分布(续)离散型随机变量的概率分布(续)指指随机变量等于或小于某一可能值(随机变量等于或小于某一可能值(x x0 0) )的的概率。概率。2022-5-31 对于离散型随机变量的任何值,都可以求对于离散型随机变量的任何值,都可以求出它的概率。而连续型随机变量则不同,出它的概率。而连续型随机变量则不同,因为试验中可以取某一区间内的任何值,因为试验中可以取某一区
9、间内的任何值,这些数值构成不可数的无穷集合。任何值这些数值构成不可数的无穷集合。任何值的概率都等于的概率都等于0 0,这并不是说这种事件不会,这并不是说这种事件不会出现,只是由于技术上的限制,在测量时出现,只是由于技术上的限制,在测量时不可能无限提高精确度不可能无限提高精确度。 在研究连续型随机变量时,实际观察值只在研究连续型随机变量时,实际观察值只能是落在一定的区间内,其概率可以不为能是落在一定的区间内,其概率可以不为0 0,当然这种区间可以很小。当然这种区间可以很小。2.2.2 2.2.2 连续型随机变量的概率分布连续型随机变量的概率分布2022-5-31 随机变量随机变量X X的值落在区
10、间(的值落在区间(x x,x+x+x x)内的)内的概率为概率为P(xP(xX Xx+x+x),x),其中其中x x为区间长为区间长度。当度。当x x趋于零时,此时趋于零时,此时区间概率称为密区间概率称为密度函数度函数: 概率密度的图形概率密度的图形y=f(x)y=f(x)称为分布曲线。称为分布曲线。xxxXxPxfx)()(lim02.2.22.2.2连续型随机变量的概率分布(续)连续型随机变量的概率分布(续)2022-5-31 分布函数分布函数(或称为累积分布函数)(或称为累积分布函数)是随机是随机变量变量X X取得小于取得小于X X0 0的值的概率的值的概率 对于任意两点对于任意两点a
11、a和和b(a b(a b)b),下式成立:,下式成立: P(Xa) + Xa) + P(a aXb) = Xb) = P(Xb)Xb) 或或P(a aXb) = FXb) = F(b) -Fb) -F(a) a) 0)()()(0 xodxxfxXPxF2.2.22.2.2连续型随机变量的概率分布(续)连续型随机变量的概率分布(续)2022-5-31 通过样本数据得到的频率分布称为统计分布或通过样本数据得到的频率分布称为统计分布或经验分布,经验分布,描述总体的概率分布称为理论分布描述总体的概率分布称为理论分布或总体分布。或总体分布。 频率分布可出现各种类型:两侧对称,不对称,频率分布可出现各种
12、类型:两侧对称,不对称,但对于不同的频率分布均有相应理论分布,即但对于不同的频率分布均有相应理论分布,即随机变量变化规律的理想化数学模型。虽然很随机变量变化规律的理想化数学模型。虽然很难与实际情况完全一致,但近似得非常好,因难与实际情况完全一致,但近似得非常好,因此可以用建立在概率分布基础上的统计规律来此可以用建立在概率分布基础上的统计规律来解决实际问题。解决实际问题。如果我们从总体中取出了一个如果我们从总体中取出了一个很大的样本,可把这个样本的分布近似作为总很大的样本,可把这个样本的分布近似作为总体的分布。体的分布。2.2.32.2.3概率分布与频率分布的关系概率分布与频率分布的关系2022
13、-5-31 样本特征数是描述频率分布特征的:样本特征数是描述频率分布特征的:统统计量计量 总体特征数是描述概率分布特征的:总体特征数是描述概率分布特征的:参参数数 总体特征数包括随机变量的总体特征数包括随机变量的数学期望数学期望(理论平均数),方差(理论平均数),方差和和各阶矩各阶矩,可以,可以用类似求样本特征数方法求得。用类似求样本特征数方法求得。2.3 2.3 总体特征数总体特征数2022-5-31 总体特征数总体特征数:描述概率分布特征的数字,包括:描述概率分布特征的数字,包括数学期望、方差和各阶矩。数学期望、方差和各阶矩。 所谓所谓X X或或X X的函数的数学期望,即它们的理论的函数的
14、数学期望,即它们的理论平均数。样本平均数:平均数。样本平均数:kiiikiixnfnfxx11)()(xxxpxE)()(2.3.1 随机变量的数学期望和方差随机变量的数学期望和方差随着随着n n的充分增加,平均数稳定于总体平均数的充分增加,平均数稳定于总体平均数2022-5-31频数资料的样本方差和标准差频数资料的样本方差和标准差)(1(12xxnfskiii)()(222XExxpx1)()(1122nnfdfdskikiii222)()(XEXE)()(22XExxpx2.3.1 随机变量的数学期望和方差(续)随机变量的数学期望和方差(续)总体方差和标准差总体方差和标准差2022-5-3
15、1 X X或或X X的函数的的函数的数学期望数学期望可用通式表示可用通式表示)()()(xxgxpXgE2.3.1 随机变量的数学期望和方差(续)随机变量的数学期望和方差(续)kiiikiiikiikkkxxpxpxxpxpxpxpxxpxxpxxp111212211)()()()(.)()()(.)()(随机变量的随机变量的数学期望就是这个随机变量的所有数学期望就是这个随机变量的所有可能值,以其相应概率为权的加权平均数可能值,以其相应概率为权的加权平均数。2022-5-31 连续型随机变量的连续型随机变量的数学期望定义为数学期望定义为dxxxfXE)()(2.3.1 随机变量的数学期望和方差
16、(续)随机变量的数学期望和方差(续)dxxfxXE)()()(222 连续型随机变量方差定义为连续型随机变量方差定义为2022-5-312.3.2 数学期望和方差的运算数学期望和方差的运算2022-5-312.4 2.4 几种常见的概率分布律几种常见的概率分布律2.4.1 2.4.1 二项分布二项分布 二项分布在生物学中应用很广,其特征如下:二项分布在生物学中应用很广,其特征如下:每次试验只有两个对立结果每次试验只有两个对立结果(A A和和););N N次试验是重复次试验是重复,独立的独立的。 回放式抽样适合于二项分布;非回放式抽样适回放式抽样适合于二项分布;非回放式抽样适合于超几何分布。合于
17、超几何分布。xnxxncxp)1 ()(二项分布概率函数二项分布概率函数2022-5-31,nnn)1 (),1 (22)1 (211n6)1 (12n2.4.1 2.4.1 二项分布(续)二项分布(续)服从二项分布的随机变量的特征数服从二项分布的随机变量的特征数(用比率表示时)(用比率表示时)平均数平均数方差方差偏斜度偏斜度峭度峭度(用比率表示时)(用比率表示时)2022-5-31 二项分布决定于两个参考数:试验次数二项分布决定于两个参考数:试验次数和概率,因此其图形变化趋势与这两个和概率,因此其图形变化趋势与这两个参数有关参数有关随试验次数的增大图形分布趋于对称;而随试验次数的增大图形分布
18、趋于对称;而且当概率趋于且当概率趋于0.50.5时分布趋于对称时分布趋于对称偏斜度和峭度是与试验次数和概率有关。偏斜度和峭度是与试验次数和概率有关。当当 相同时,随样本含量的增加,相同时,随样本含量的增加,11和和22逐渐接近于逐渐接近于0 0(正态分布);或样本含量相(正态分布);或样本含量相同时,同时, 愈接近于愈接近于0.50.5, 11和和22愈接近于愈接近于0 0。表表3-1 P373-1 P37 二项式分布应用实例二项式分布应用实例 2.4.1 2.4.1 二项分布(续)二项分布(续)2022-5-31 在生物统计学中,正态分布占有极其重在生物统计学中,正态分布占有极其重要的地位。
展开阅读全文