05-概率分布-正态分布教程课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《05-概率分布-正态分布教程课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 05 概率 分布 正态分布 教程 课件
- 资源描述:
-
1、第五讲 概率分布正态分布1.1 1.1 正态分布的概念和函数正态分布的概念和函数1.2 1.2 正态分布曲线的特征正态分布曲线的特征1.31.3 正态曲线的标化正态曲线的标化1.4 1.4 曲线下面积的分布规律曲线下面积的分布规律1. 1.5 5 正态分布在医学中的应用正态分布在医学中的应用正态分布及其应用【典型案例分析典型案例分析】举例:举例: 随机调查某医院随机调查某医院14021402例待分娩孕例待分娩孕妇,测得她们的体重,试述其体重频数分妇,测得她们的体重,试述其体重频数分布的特征。布的特征。引子:引子:表表5-1 某医院某医院1402例分娩孕妇体重频数分布例分娩孕妇体重频数分布 0.
2、000.020.040.060.0848-56-64-72-80-体重(kg)体重频率密度 作图作图:以体重测量值为以体重测量值为横轴横轴,以频率与组距的,以频率与组距的比值为比值为纵轴纵轴作出直方图。作出直方图。1. 由于该直方图的纵轴由于该直方图的纵轴表示在每个组段内单位表示在每个组段内单位长度所占有的频率,相长度所占有的频率,相当于当于频率密度频率密度,因此将,因此将此图称为此图称为频率密度图频率密度图。 图图5-1 体重频率密度图体重频率密度图 2. 面积面积=频率频率由于频率的总和为由于频率的总和为1,所以该曲线下横轴上所以该曲线下横轴上的面积为的面积为1 。 .0.000.020.
3、040.060.0848-56-64-72-80-体重(kg)体重频率密度若将各直条顶端的中点顺次连接起来若将各直条顶端的中点顺次连接起来,得一条折线。当样得一条折线。当样本量本量n越来越大时,折线就越来越接近一条光滑的曲线越来越大时,折线就越来越接近一条光滑的曲线。 图5-1 体重频率密度图 图5-2 概率密度曲线示意图 推推 断:断:测得一个孕妇体重在测得一个孕妇体重在54-68kg54-68kg的概率有多大?的概率有多大?孕妇体重在哪个范围内算是正常的呢?孕妇体重在哪个范围内算是正常的呢?故对连续性随机变量而言:故对连续性随机变量而言:变量某区间取值的概率变量某区间取值的概率 = = 正
4、态曲线该变量区间的面正态曲线该变量区间的面积积密度 正态分布正态分布( normal distribution):是描述连续型:是描述连续型随机变量最重要的分布。其分布曲线叫正态分布随机变量最重要的分布。其分布曲线叫正态分布曲线,呈中间高,两边低,左右基本对称的曲线,呈中间高,两边低,左右基本对称的“钟钟型型”曲线,近似于数学上的正态分布,曲线,近似于数学上的正态分布,又称高斯又称高斯分布(分布(Gauss distribution)。正态分布正态分布( (normal distribution)德莫佛最早发现了二项概率德莫佛最早发现了二项概率的一个近似公式,这一公式被的一个近似公式,这一公式
5、被认为是正态分布的首次露面。认为是正态分布的首次露面。正态分布在十九世纪前叶由正态分布在十九世纪前叶由高斯加以推广,所以通常称为高斯加以推广,所以通常称为高斯分布高斯分布( (Gauss distribution)。德莫佛德莫佛高高 斯斯10马克的钱币马克的钱币 医学研究中许多正常人的生理,生化指标、测医学研究中许多正常人的生理,生化指标、测量误差等多呈正态分布或近似正态分布。量误差等多呈正态分布或近似正态分布。许多非正态分布资料,当样本含量足够大时,许多非正态分布资料,当样本含量足够大时,也可以用正态分布作为它的极限分布形式。也可以用正态分布作为它的极限分布形式。有时也可将非正态分布资料转化
6、为正态分布来有时也可将非正态分布资料转化为正态分布来处理。处理。正态分布在医学研究中的重要作用:正态分布在医学研究中的重要作用:医学研究中:医学研究中:正态分布的密度函数正态分布的密度函数,即正态曲线的函数表达式:即正态曲线的函数表达式:XeXfX,21)(222/)( 式中,式中,为为总体均数,总体均数,为为总体标准差,总体标准差,为圆周率,为圆周率,e为为自然对数的底,仅自然对数的底,仅x为变量。为变量。 当当x确定后,确定后, f(x)为为X相应的纵坐标高度,则相应的纵坐标高度,则X服从参数服从参数为为和和2的正态分布(的正态分布( normal distribution),记作记作XN
7、( ,2 )。)。 XeXfX,21)(222/)(总体均数总体均数总体标准差总体标准差(一)正态分布的两个参数:(一)正态分布的两个参数: 和和 是正态分布的是正态分布的两个参数两个参数, 和和决定了决定了x的概率分布;习惯上用的概率分布;习惯上用 N (, 2)表示均数为表示均数为 ,标,标准差为准差为的正态分布。的正态分布。 当给定不同的当给定不同的 x 值后,就可以根据此方程求得相应的值后,就可以根据此方程求得相应的纵坐标高度(频数),并可绘制出正态曲线的图形,记纵坐标高度(频数),并可绘制出正态曲线的图形,记作作XN(,2) :正态分布曲线正态分布曲线:高峰位于中间,两侧逐渐下降并完
8、全对:高峰位于中间,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的称,曲线两端永远不与横轴相交的“钟型钟型”曲线。曲线。当当固定不变时,固定不变时,越大,曲线沿横轴越大,曲线沿横轴越向右移动;反之,越向右移动;反之, 越小,则曲线沿横轴越向左移越小,则曲线沿横轴越向左移动,所以动,所以叫正态曲线叫正态曲线N(, 2)的)的位置参数位置参数, 。1. 位置参数:位置参数: 图图5-4 正态分布位置随参数正态分布位置随参数变换示意图变换示意图=1=1.5=22. 形状参数形状参数: 图图5-6 正态分布形态随参数正态分布形态随参数变换示意图变换示意图 当当固定不变时,固定不变时,越大,曲线越平
9、阔;越大,曲线越平阔; 越小,曲线越尖峭,越小,曲线越尖峭, 叫叫正态曲线正态曲线N(, 2)的)的形形状参数状参数。 (二)正态分布图形的特征:(二)正态分布图形的特征:1. 对称性:关于对称性:关于x=对称对称2. 集中性:集中性: 正态曲线在横轴上方,正态曲线在横轴上方, 当当x=时时, f (x)取最大值,即均数位于曲线的最高处。取最大值,即均数位于曲线的最高处。3. 对对频率密度正态分布图,横轴上频率密度正态分布图,横轴上曲线下的面积为曲线下的面积为1。4. 是正态曲线的位置参数,决定曲线在横轴上的位置;是正态曲线的位置参数,决定曲线在横轴上的位置; 增大曲线沿横轴向右移,增大曲线沿
10、横轴向右移, 减小曲线沿横轴向左移。减小曲线沿横轴向左移。5.是正态曲线的形状参数,是正态曲线的形状参数,越大数据越分散,曲线越越大数据越分散,曲线越“矮胖矮胖”,越小数据越集中,曲线越越小数据越集中,曲线越“瘦高瘦高” 。 为了应用方便,常将正态概率函数中的为了应用方便,常将正态概率函数中的 x 作如作如下变量代换,令:下变量代换,令: Z称为标准正态变量。把称为标准正态变量。把u代入概率密度函数代入概率密度函数 ,得标准正态分布的概率密度函数:得标准正态分布的概率密度函数: 相对于正态变量相对于正态变量 x,Z 没有度量单位。根据没有度量单位。根据 u 的不同取值,可绘出标准正态分布的图形
11、。的不同取值,可绘出标准正态分布的图形。xZueZu,21)2/j(2任意正态分布曲线任意正态分布曲线 XN(,2)标准正态分布曲线标准正态分布曲线XN(0,1) 将一般正态分布曲线的将一般正态分布曲线的 的位置平移到原点,再的位置平移到原点,再以标准差以标准差为横轴单位,这样就把原来个别的正态分布为横轴单位,这样就把原来个别的正态分布转换为一般的标准正态分布转换为一般的标准正态分布 N(0,1),亦称为),亦称为Z分布分布(或(或 分布分布)。)。 正态曲线下的面积分布有一定的规律性:正态曲线下的面积分布有一定的规律性: 因正态曲线下累计频数的总和等于因正态曲线下累计频数的总和等于 100%
12、 或或 1,则:,则:横轴上曲线下的面积(概率)就等于横轴上曲线下的面积(概率)就等于 100% 或或 1;均数两侧的面积(概率)各占均数两侧的面积(概率)各占 50%。实际工作中常需了解横轴上某一区间曲线下面积占实际工作中常需了解横轴上某一区间曲线下面积占总面积的百分比,以便估计该区间的频数占总频数的百总面积的百分比,以便估计该区间的频数占总频数的百分比(即频数分布情况)。这就需要采用定积分的办法,分比(即频数分布情况)。这就需要采用定积分的办法,对函数式对函数式 (1) 或或 (2) 定积分,算得从定积分,算得从 - 到到 x,或从,或从 - 到到 Z 的累计面积(概率)。的累计面积(概率
13、)。 .x图 6 正态分布(左)及标准正态曲线下(右)的累计面积dxexFxx)2/()(2221)(ZdZZ2221)(jeZZ/ 由于引入了标准正态变量由于引入了标准正态变量 Z 值,只需对标准正值,只需对标准正态公式求定积分,求其曲线下从态公式求定积分,求其曲线下从 -到任意到任意Z 值的累值的累计面积,并制成专用的计面积,并制成专用的 Z 值表(见附表);这样值表(见附表);这样对对于其它任意的正态分布于其它任意的正态分布N(, 2) ,都可以通过变量,都可以通过变量代换转化为标准正态分布代换转化为标准正态分布,通过查表就完成其概率,通过查表就完成其概率计算问题。计算问题。1. 左半侧
14、左半侧 Z 值对应面积的查法:值对应面积的查法:1. 标准正态分布区间(标准正态分布区间(-1, 1 )的面积占总面积的)的面积占总面积的68.26% 2. 标准正态分布区间(标准正态分布区间(-1.96,1.96)的面积占总面积的)的面积占总面积的95% 3. 标准正态分布区间(标准正态分布区间(-2.58,2.58)的面积占总面积的)的面积占总面积的99% 标准正态分布曲线下面积规律标准正态分布曲线下面积规律举例:举例: 当当 Z = -1.96时,左侧的累计面积时,左侧的累计面积= 0.025(该区间累(该区间累计频数占总例数的计频数占总例数的 2.5%),记作),记作 P(Z1.96)
展开阅读全文