医科大学精品课件:概率分布(研).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医科大学精品课件:概率分布(研).ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医科大学 精品 课件 概率 分布
- 资源描述:
-
1、3 概率分布,统计 描述,抽样分布参数估计:点估计、区间估计,定量资料,定性资料:频率型指标、强度型指标、比,统计表和统计图,统计 推断,变量,概率分布:正态分布、二项分布、Possion分布,假设检验,实验设计,分组数,实验设计:三要素、四原则、实验设计方案、样本含量估算,教学内容:,应了解具有普遍意义的、样本所在总体分布的情况,随机变量的分布常见的有三种类型:,3.1.1 正态分布概念和特征 3.1.2 标准正态分布 . 3.1.3 正态分布的应用 . 3.1.4 正态分布的判断 .,3.1.1 正态分布的概念和特征,举例: 某妇产科医生观察1402例临产母亲体重资料(kg),试述其体重频
2、数分布的特征。,表5-1 某医院1402例待分娩孕妇体重频数分布, ,作图:以体重测量值为横轴,频率密度为纵轴作出直方图,此图即称为频率密度图;纵轴表示的是每个组段内单位长度所占有的频率。,图5-1 体重频率密度图,若将各直条顶端的中点顺次连接起来,得一条折线。当样本量 n 越来越大时,组距越来越小,折线就越来越接近一条光滑的曲线。,图5-1 体重频率密度图,图5-2 概率密度曲线示意图,正态分布( normal distribution): 是描述连续型随机变量最重要的分布,又称高斯分布(Gauss distribution)。 医学研究中许多正常人的生理、生化指标的变量分布呈正态分布或近似
3、正态分布。,图5-1 体重频率密度图,由于频率的总和为1,所以该曲线下横轴上的面积为1 面积=频率,正态分布的密度函数,即正态曲线的函数表达式,正态分布曲线:两个参数 和决定了x的概率分布,习惯上用 N (, 2)表示均数 ,标准差的正态分布。,当固定不变时,越大,曲线沿横轴越向右移动;反之, 越小,则曲线沿横轴越向左移动,所以叫正态曲线N(, 2)的位置参数, 。, 位置参数: ,图5-4 正态分布位置随参数变换示意图, 形状参数:,图5-6 正态分布形态随参数变换示意图,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭, 叫正态曲线N(, 2)的形状参数。,1. 单峰、对称分布,对称轴 x
4、=,2. 正态分布N (, 2) 中的两个参数: : 位置参数,决定曲线在横轴上的位置; 增大曲线沿横轴向右移, 减小曲线沿横轴向左移。 : 形状参数,越大数据越分散,曲线越“矮胖”,越小数据越集中,曲线越“瘦高” 。,4. x 取值从- 至+ ,相应的概率密度函数f (x) 对应的曲线位于X轴的上方,与X轴永不相交,正态变量在x=时,概率 f (x)取值最大,两边逐渐减少。,3. 当 x=时, f (x)取最大值,即 均数位于曲线的最高处。峰值为:,(5)正态分布曲线下面积的规律,1.正态曲线下累计频数的总和等于 1,则: 横轴上曲线下的面积(概率)就等于 或 1; 均数两侧的面积(概率)各
5、占 50%。,- a b,- a,2.正态曲线N (, 2)下,如下 x 值对应的面积规律:,3.1.2 标准正态分布,由, 决定的正态分布曲线 N (, 2)具有多样性,为了应用方便,常将正态概率函数中的 x 作如下变量代换,令: Z称叫对应于观测值x的标准得分(standard score)。把Z代入概率密度函数 ,得标准正态分布的概率密度函数: 相对于正态变量 x,Z 没有度量单位。根据 u 的不同取值,可绘出标准正态分布的图形。,任意正态分布曲线 XN(,2),标准正态分布曲线 XN(0,1),将一般正态分布曲线的 的位置平移到原点,再以标准差为横轴单位,这样就把原来个别的正态分布转换
6、为一般的标准正态分布 N(0,1),亦称为 Z分布。,采用定积分的办法,对函数式 (1) 或 (2) 定积分,算得从 - 到 x 累计面积,从而推算出该区间事件发生的概率值。 .,图 6 正态分布(左)及标准正态曲线下(右)的累计面积,例3-1:设ZN(0,1),试计算: (1)Z 取值区间在(- , - 1.96) 内的概率P ? (2)Z 取值区间在(+1.96 ,+ ) 内的概率P ? (3)Z 取值区间在(- 1.96 ,+1.96)内的概率P ?,解析:,ZN (0,1),-1.96,95%,故:求一般正态分布N(,2)曲线下的面积:, 先求 Z 值:, 根据 Z 值在表中查出相应的
7、面积值,当总体均数和总体标准差未知时,就用样本均数和样本标准差来代替计算。,所以对正态分布或近似正态分布资料,只要求出均数和标准差,便可就其频数分布作出概略估计了。,X= -1.96时,所对应的左侧累积概率是多少? X= +1.96时,所对应的右侧累积概率是多少? X在( -1.96 , +1.96 )间对应概率是多少?,正态分布N (, 2)下:,ZN (0,1),95%,-1.96,2.5%,2.5%, +1.96,N (, 2),95%,常用的正态分布、标准正态分布曲线下面积规律,3.1.3 正态分布的应用,1. 概率计算:120 名 8 岁男孩身高均数 123.02 cm,标准差为 4
8、.79 cm,试估计: (1)身高在130以上者占该地8岁男孩总数的百分比;(2)身高在120128者占该地8岁男孩总数的百分比;(3)该地80%男孩的身高集中在哪个范围?,解析:,N (0,1),7.21%,7.21%,(2)身高在120128者占该地8岁男孩总数的百分比;,(3)该地80%男孩的身高集中在哪个范围?,解析:,N (123.02,4.792),解析:,120cm,128cm,-0.63,1.46,58.65%,58.65%,N (123.02,4.792),2. 确定医学参考值范围,参考值范围(reference range):指特定“正常”人群的解剖、生理、生化指标及组织代
9、谢含量等数据中大多数个体取值所在的范围。,1. 所谓“正常人”不是指“健康人”,而是指排除了对所研究的指标有影响的疾病和有关因素的特定人群,必须是随机选择的。 2.样本含量足够大:100例以上,举例:制定成年健康女性血红蛋白的参考值范围,制定步骤:,首先要确定一批样本含量足够大的“正常人”,进行样本相关指标测量,整理数据,进行资料分布类型的诊断。, 百分位法:适用于任何分布类型资料,特别是偏态分布资料以及一端或两端无确切数值的资料。,如95%参考值范围:,以不同的方法计算参考值范围:,0 100,而后根据指标的实际用途确定单侧或双侧界值。,根据研究目的和使用要求选定适当的百分界值,最常用的是9
展开阅读全文