第5章-常用概率分布课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第5章-常用概率分布课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 概率 分布 课件
- 资源描述:
-
1、2023-1-71中山大学医学统计与流行病学系中山大学医学统计与流行病学系张晋昕张晋昕2010.11.22 2023-1-722023-1-73 一、正态分布的概念一、正态分布的概念 第一节第一节 正态分布正态分布 正态分布是自然界最常见的一种分布,正态分布是自然界最常见的一种分布,若指标若指标X的频率分布曲线对应于数学上的正态分布曲线,的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。则称该指标服从正态分布。2023-1-742023-1-752023-1-76正态分布的概率密度函数(即纵向的曲线高度)正态分布的概率密度函数(即纵向的曲线高度),21221XeXf-X+202
2、3-1-77 均数为均数为0,标准差为,标准差为1的正态分布,这种正态分布的正态分布,这种正态分布称为称为标准正态分布标准正态分布。2221ZeZf-Z+标准正态分布的密度函数:标准正态分布的密度函数:对于任意一个服从正态分布对于任意一个服从正态分布N(,2)的随机变量,的随机变量,可作如下的可作如下的标准化变换标准化变换,也称,也称Z变换变换,XZ2023-1-78正态分布的特征正态分布的特征 1.关于关于 对称。即正态分布以均数为中对称。即正态分布以均数为中心,左右对称。心,左右对称。2.在在 处取得概率密度函数的最大值,处取得概率密度函数的最大值,在在 处有处有拐点拐点,表现为,表现为
3、钟形曲线。即正钟形曲线。即正态曲线在横轴上方均数处最高。态曲线在横轴上方均数处最高。xxx2023-1-79 3.正态分布有两个参数,即均数正态分布有两个参数,即均数和标准差和标准差。是是位置参数位置参数,是是变异度参数变异度参数(形状参数形状参数)。常用。常用N(,2)表示均数为表示均数为 ,标准差为,标准差为的正态分布;用的正态分布;用N(0,1)表示标准正态分布。表示标准正态分布。4.正态曲线下面积分布有一定规律。横轴上正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于正态曲线下的面积等于1(也常写作也常写作100%)。2023-1-710 二、正态曲线下面积的分布规律二、正态曲线
4、下面积的分布规律正态方程的积分式正态方程的积分式(分布函数分布函数):,21221dXeXFXX F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自到X的面积,即下侧累计面积。标准正态分布方程积分式标准正态分布方程积分式(分布函数分布函数):dZe21z2zZ2 (Z)为标准正态变量 Z的累计分布函数,反映标准正态曲线下,横轴尺度自到Z的面积,即下侧累计面积。2023-1-711 Z 2023-1-712 用查表代替计算必须注意:1)表中曲线下面积为)表中曲线下面积为到到Z的面积。的面积。2)当当,和和X已知时已知时,先求出,先求出Z值,值,再用再用Z值查表,得所求区间占总面积的比
5、例。值查表,得所求区间占总面积的比例。当当和和未知时未知时,要用样本均数和样本标准差,要用样本均数和样本标准差S来估计来估计Z值。值。3)曲线下对称于)曲线下对称于0的区间,面积相等。的区间,面积相等。4)曲线下横轴上的面积为)曲线下横轴上的面积为1(即(即100%)。)。XZ SXXZ 三、标准正态分布表三、标准正态分布表2023-1-713 正态分布是一种对称分布,其对称轴为直线正态分布是一种对称分布,其对称轴为直线X=,即均数,即均数位置,理论上:位置,理论上:1范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96范围内曲线下的面积占总面积的范围内曲线下的面积占总
6、面积的95%2.58范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%实际应用中实际应用中:1 S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的68.27%1.96 S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的95%2.58 S范围内曲线下的面积占总面积的范围内曲线下的面积占总面积的99%XXX2023-1-7142023-1-715标准正态分布的标准正态分布的=0,=1,则,则相当于区间相当于区间(-1,1),1.96相当于区间相当于区间(-1.96,1.96),2.58的区间相当于区间的区间相当于区间(-2.58,2.58)。区间区间(-1,1)的面积:
7、的面积:1-2(-1)=1-20.1587=0.6826=68.26%区间区间(-1.96,1.96)的面积:的面积:1-2(-1.96)=1-20.0250=0.9500=95.00%区间区间(-2.58,2.58)的面积:的面积:1-2(-2.58)=1-20.0049=0.9902=99.02%2023-1-716 正态曲线下面积对称,则区间(正态曲线下面积对称,则区间(1.96,)的面积也是)的面积也是0.025。Z取值于(取值于(-1.96,1.96)的概率为)的概率为1-20.025=0.95,即,即X取值在区间取值在区间 上的概率为上的概率为95%。例例 5-11 X服从均数为服
8、从均数为 ,标准差为,标准差为 的正态的正态分布,试估计分布,试估计(1)X取值在区间取值在区间 上的概率;上的概率;(2)X取值在区间取值在区间 上的概率;上的概率;96.158.2先做标准化变换:96.1)96.1(11xz96.1)96.1(22xz 025.096.11 z96.12023-1-717例例 5-12 已知某地已知某地1986年年120名名8岁男童身高均数岁男童身高均数 ,S=4.79 cm ,估计,估计(1)该地该地8岁男孩身高在岁男孩身高在130 cm以上者占该地以上者占该地8岁岁男孩总数的百分比;男孩总数的百分比;(2)身高界于身高界于120cm128cm者占该地者
9、占该地8岁男孩岁男孩总数的比例;总数的比例;(3)该地该地80%男孩身高集中在哪个范围?男孩身高集中在哪个范围?先做标准化变化先做标准化变化:cm02.123X 46.179.402.123130SXXz 0721.046.1z 理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的7.21%。2023-1-71804.179.402.12312863.079.402.12312021zz 2643.063.01 z 5865.02643.08508.012zz(2)8508.004.112 z2023-1-719(3)查附表查附表1,标准正态分布曲线下左侧面积为,标准正态分布曲线下左
10、侧面积为0.10所对应所对应的的Z值为值为-1.28,所以,所以80%的的8岁男孩身高值集中在岁男孩身高值集中在 区间内,即区间内,即116.9cm129.2cmS28.1X 2023-1-720(一)制定医学参考值范围(一)制定医学参考值范围v参考值范围:指特定的参考值范围:指特定的“正常正常”人群的解剖、生理、生化、人群的解剖、生理、生化、免疫等各种数据的波动范围。免疫等各种数据的波动范围。v制定参考值范围的步骤:制定参考值范围的步骤:1.选择足够数量的正常人作为调查对象。选择足够数量的正常人作为调查对象。2.样本含量足够大。样本含量足够大。3.确定取单侧还是取双侧正常值范围。确定取单侧还
11、是取双侧正常值范围。4.选择适当的百分界限。选择适当的百分界限。5.选择适当的计算方法。选择适当的计算方法。四、四、正态分布的应用正态分布的应用2023-1-721v估计医学参考值范围的方法:估计医学参考值范围的方法:1.正态近似法正态近似法:适用于正态分布或近似正态分布的资料。:适用于正态分布或近似正态分布的资料。2.百分位数法百分位数法:适用于偏态分布资料。:适用于偏态分布资料。2023-1-722 例例5-13 某地调查某地调查120名健康女性血红蛋白,直方图名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为显示,其分布近似于正态分布,得均数为117.4g/L,标准差为标准差
12、为10.2g/L,试估计该地正常女性血红蛋白的,试估计该地正常女性血红蛋白的95%医学参考值范围。医学参考值范围。分析:分析:正常人的血红蛋白过高过低均为异常,要制正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。定双侧正常值范围。39.13741.972.1096.14.117S96.1X 该指标的该指标的95%医学参考值范围为医学参考值范围为 L/g39.13741.972023-1-723 例例5.14 某地调查某地调查110名正常成年男子的第一秒肺名正常成年男子的第一秒肺通气量,得均数为通气量,得均数为4.2 L,标准差为,标准差为0.7 L,试估计该地,试估计该地正常成年男子第
13、一秒肺通气量的正常成年男子第一秒肺通气量的95%参考值范围。参考值范围。052.37.064.12.464.1SX 该地正常成年男子第一秒肺通气量的该地正常成年男子第一秒肺通气量的95%参考参考值范围为:不低于值范围为:不低于3.052L。分析:分析:正常人的第一秒肺通气量近似正态分布,且只正常人的第一秒肺通气量近似正态分布,且只以过低为异常,要制定单侧下限。以过低为异常,要制定单侧下限。2023-1-724 例例 5.15 某年某市调查了某年某市调查了 200例正常成人血铅含例正常成人血铅含量(量(g/100g)如下,试估计该市成人血铅含量的如下,试估计该市成人血铅含量的95%医学参考值范围
14、。医学参考值范围。2023-1-725 g/g.%f%x.nfiLPLx10073818995200753895 分析:血铅的分布为偏峰分布,且血铅含量只以分析:血铅的分布为偏峰分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。过高为异常,要用百分位数法制定单侧上限。2023-1-726二、质量控制二、质量控制 为了控制实验中的检测误差,常用 2S作上下警戒线,以 3S作为上下控制线。这里的2S和3S可视为1.96S 和2.58S的约数。其依据是正常情况下检测误差是服从正态分布的。XX2023-1-727第三节第三节 正态分布及其应用正态分布及其应用判断异常的判断异常的8 8种情况是
15、:种情况是:v有一个点距中心线的距离超过有一个点距中心线的距离超过3 3个标准差(控制限以外)个标准差(控制限以外)v在中心线的一侧连续有在中心线的一侧连续有9 9个点个点v连续连续6 6个点稳定地增加或减少个点稳定地增加或减少v连续连续1414个点交替上下个点交替上下v连续连续3 3个点中有两个点距中心线距离超过个点中有两个点距中心线距离超过2 2个标准差(警戒限个标准差(警戒限以外)以外)2023-1-728第三节第三节 正态分布及其应用正态分布及其应用v连续连续5 5个点中有个点中有4 4个点距中心线距离超过个点距中心线距离超过1 1个标准差个标准差v中心线一侧或两侧连续中心线一侧或两侧
16、连续1515个点距中心线距离都在个点距中心线距离都在1 1个标准差个标准差以内以内v中心线一侧或两侧连续中心线一侧或两侧连续8 8个点距中心线距离都超出个点距中心线距离都超出1 1个标准差个标准差范围。范围。2023-1-729 三、统计处理方法的理论基础三、统计处理方法的理论基础如如 统计描述中计算算术平均数、标准差、统计描述中计算算术平均数、标准差、统计推断中进行总体均数置信区间估计、统计推断中进行总体均数置信区间估计、t 检验、检验、F 检验、相关与回归等分析检验、相关与回归等分析2023-1-730(一)成败型实验(一)成败型实验(BernoulliBernoulli实验)实验)在医学
17、卫生领域的许多实验或观察中,人们感兴在医学卫生领域的许多实验或观察中,人们感兴趣的是某事件是否发生。如用白鼠做某药物的毒性实趣的是某事件是否发生。如用白鼠做某药物的毒性实验,关心的是白鼠是否死亡;某种新疗法临床实验观验,关心的是白鼠是否死亡;某种新疗法临床实验观察患者是否治愈;观察某指标的化验结果是否呈阳性察患者是否治愈;观察某指标的化验结果是否呈阳性等等。将我们关心的事件将我们关心的事件A A出现称为成功,不出现称为失出现称为成功,不出现称为失败,这类试验就称为成败,这类试验就称为成-败型实验。指定性资料中的二败型实验。指定性资料中的二项分类实验。项分类实验。第二节第二节 二项分布二项分布
18、一、二项分布的概念与特征一、二项分布的概念与特征 2023-1-731 成成-败型(败型(BernoulliBernoulli)实验序列:)实验序列:满足以下三个条件的满足以下三个条件的n n次实验构成的序列称为成次实验构成的序列称为成-败型实败型实验序列。验序列。1 1)每次实验结果,只能是两个互斥的结果之一()每次实验结果,只能是两个互斥的结果之一(A A或或非非A A)。)。2)2)相同的实验条件下,每次实验中事件相同的实验条件下,每次实验中事件A A的发生具有的发生具有相同的概率相同的概率。(非。(非A A的概率为的概率为1-1-)。)。实际工作中要求实际工作中要求是从大量观察中获得的
19、较稳定的是从大量观察中获得的较稳定的数值。数值。3)3)各次实验独立。各次的实验结果互不影响。各次实验独立。各次的实验结果互不影响。2023-1-732(二)二项分布的概率函数(二)二项分布的概率函数 二项分布是指在只能产生两种可能结果(如二项分布是指在只能产生两种可能结果(如“阳性阳性”或或“阴性阴性”)之一的)之一的n次独立重复实验中,当次独立重复实验中,当每次试验的每次试验的“阳性阳性”概率保持不变时,出现概率保持不变时,出现“阳性阳性”的的次数次数X=0,1,2,X=0,1,2,n,n的一种概率分布。的一种概率分布。若从阳性率为若从阳性率为的总体中随机抽取大小为的总体中随机抽取大小为n
展开阅读全文