书签 分享 收藏 举报 版权申诉 / 74
上传文档赚钱

类型医科大学精品课件:概率分布(研).ppt

  • 上传人(卖家):金钥匙文档
  • 文档编号:443991
  • 上传时间:2020-04-07
  • 格式:PPT
  • 页数:74
  • 大小:3.08MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《医科大学精品课件:概率分布(研).ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    医科大学 精品 课件 概率 分布
    资源描述:

    1、3 概率分布,统计 描述,抽样分布参数估计:点估计、区间估计,定量资料,定性资料:频率型指标、强度型指标、比,统计表和统计图,统计 推断,变量,概率分布:正态分布、二项分布、Possion分布,假设检验,实验设计,分组数,实验设计:三要素、四原则、实验设计方案、样本含量估算,教学内容:,应了解具有普遍意义的、样本所在总体分布的情况,随机变量的分布常见的有三种类型:,3.1.1 正态分布概念和特征 3.1.2 标准正态分布 . 3.1.3 正态分布的应用 . 3.1.4 正态分布的判断 .,3.1.1 正态分布的概念和特征,举例: 某妇产科医生观察1402例临产母亲体重资料(kg),试述其体重频

    2、数分布的特征。,表5-1 某医院1402例待分娩孕妇体重频数分布, ,作图:以体重测量值为横轴,频率密度为纵轴作出直方图,此图即称为频率密度图;纵轴表示的是每个组段内单位长度所占有的频率。,图5-1 体重频率密度图,若将各直条顶端的中点顺次连接起来,得一条折线。当样本量 n 越来越大时,组距越来越小,折线就越来越接近一条光滑的曲线。,图5-1 体重频率密度图,图5-2 概率密度曲线示意图,正态分布( normal distribution): 是描述连续型随机变量最重要的分布,又称高斯分布(Gauss distribution)。 医学研究中许多正常人的生理、生化指标的变量分布呈正态分布或近似

    3、正态分布。,图5-1 体重频率密度图,由于频率的总和为1,所以该曲线下横轴上的面积为1 面积=频率,正态分布的密度函数,即正态曲线的函数表达式,正态分布曲线:两个参数 和决定了x的概率分布,习惯上用 N (, 2)表示均数 ,标准差的正态分布。,当固定不变时,越大,曲线沿横轴越向右移动;反之, 越小,则曲线沿横轴越向左移动,所以叫正态曲线N(, 2)的位置参数, 。, 位置参数: ,图5-4 正态分布位置随参数变换示意图, 形状参数:,图5-6 正态分布形态随参数变换示意图,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭, 叫正态曲线N(, 2)的形状参数。,1. 单峰、对称分布,对称轴 x

    4、=,2. 正态分布N (, 2) 中的两个参数: : 位置参数,决定曲线在横轴上的位置; 增大曲线沿横轴向右移, 减小曲线沿横轴向左移。 : 形状参数,越大数据越分散,曲线越“矮胖”,越小数据越集中,曲线越“瘦高” 。,4. x 取值从- 至+ ,相应的概率密度函数f (x) 对应的曲线位于X轴的上方,与X轴永不相交,正态变量在x=时,概率 f (x)取值最大,两边逐渐减少。,3. 当 x=时, f (x)取最大值,即 均数位于曲线的最高处。峰值为:,(5)正态分布曲线下面积的规律,1.正态曲线下累计频数的总和等于 1,则: 横轴上曲线下的面积(概率)就等于 或 1; 均数两侧的面积(概率)各

    5、占 50%。,- a b,- a,2.正态曲线N (, 2)下,如下 x 值对应的面积规律:,3.1.2 标准正态分布,由, 决定的正态分布曲线 N (, 2)具有多样性,为了应用方便,常将正态概率函数中的 x 作如下变量代换,令: Z称叫对应于观测值x的标准得分(standard score)。把Z代入概率密度函数 ,得标准正态分布的概率密度函数: 相对于正态变量 x,Z 没有度量单位。根据 u 的不同取值,可绘出标准正态分布的图形。,任意正态分布曲线 XN(,2),标准正态分布曲线 XN(0,1),将一般正态分布曲线的 的位置平移到原点,再以标准差为横轴单位,这样就把原来个别的正态分布转换

    6、为一般的标准正态分布 N(0,1),亦称为 Z分布。,采用定积分的办法,对函数式 (1) 或 (2) 定积分,算得从 - 到 x 累计面积,从而推算出该区间事件发生的概率值。 .,图 6 正态分布(左)及标准正态曲线下(右)的累计面积,例3-1:设ZN(0,1),试计算: (1)Z 取值区间在(- , - 1.96) 内的概率P ? (2)Z 取值区间在(+1.96 ,+ ) 内的概率P ? (3)Z 取值区间在(- 1.96 ,+1.96)内的概率P ?,解析:,ZN (0,1),-1.96,95%,故:求一般正态分布N(,2)曲线下的面积:, 先求 Z 值:, 根据 Z 值在表中查出相应的

    7、面积值,当总体均数和总体标准差未知时,就用样本均数和样本标准差来代替计算。,所以对正态分布或近似正态分布资料,只要求出均数和标准差,便可就其频数分布作出概略估计了。,X= -1.96时,所对应的左侧累积概率是多少? X= +1.96时,所对应的右侧累积概率是多少? X在( -1.96 , +1.96 )间对应概率是多少?,正态分布N (, 2)下:,ZN (0,1),95%,-1.96,2.5%,2.5%, +1.96,N (, 2),95%,常用的正态分布、标准正态分布曲线下面积规律,3.1.3 正态分布的应用,1. 概率计算:120 名 8 岁男孩身高均数 123.02 cm,标准差为 4

    8、.79 cm,试估计: (1)身高在130以上者占该地8岁男孩总数的百分比;(2)身高在120128者占该地8岁男孩总数的百分比;(3)该地80%男孩的身高集中在哪个范围?,解析:,N (0,1),7.21%,7.21%,(2)身高在120128者占该地8岁男孩总数的百分比;,(3)该地80%男孩的身高集中在哪个范围?,解析:,N (123.02,4.792),解析:,120cm,128cm,-0.63,1.46,58.65%,58.65%,N (123.02,4.792),2. 确定医学参考值范围,参考值范围(reference range):指特定“正常”人群的解剖、生理、生化指标及组织代

    9、谢含量等数据中大多数个体取值所在的范围。,1. 所谓“正常人”不是指“健康人”,而是指排除了对所研究的指标有影响的疾病和有关因素的特定人群,必须是随机选择的。 2.样本含量足够大:100例以上,举例:制定成年健康女性血红蛋白的参考值范围,制定步骤:,首先要确定一批样本含量足够大的“正常人”,进行样本相关指标测量,整理数据,进行资料分布类型的诊断。, 百分位法:适用于任何分布类型资料,特别是偏态分布资料以及一端或两端无确切数值的资料。,如95%参考值范围:,以不同的方法计算参考值范围:,0 100,而后根据指标的实际用途确定单侧或双侧界值。,根据研究目的和使用要求选定适当的百分界值,最常用的是9

    10、5%。,N (0,1 ),N (, 2 ), 正态分布法:适用于正态或近似正态分布资料,举例1 调查某地120名健康女性血红蛋白,直方图显示其分布近似正态, 试估计该地健康女性血红蛋白的95%参考值范围。,解析:,1. 分布近似正态,2. 过高过低均为异常,3. 求上、下界值,上界:,下界:,所以,该地健康女性血红蛋白的95%参考值范围是(97.41,137.39)g/l。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。,若按左单侧算,则是97.5% 参考值范围,按左单侧算,是95% 参考值范围,举例2: 某地调查120名健康成年男性的第一秒肺通气量得均数 X =4.2

    11、(L), 标准差S =0.7(L),试据此估计其第一秒肺通气量的95%参考值范围。,解析:,1. 分布近似正态,2. 仅过低为异常,3. 求下界值,下界:,所以,该地健康成年男子第一秒肺通气量的95%参考值范围为不低于3.05(L)。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。,双侧临界值:标准正态分布双侧尾部面积之和等于时所对应的正侧变量值,记作Z/2。,正确地理解参考值范围:,没有绝对的正常和异常,正常中含有“异常”,异常中含有“正常”; 不同实验环境、不同仪器检测的灵敏度和精确度不完全一样; 某些指标有必要按性别、年龄或其它因素分别制定参考值。,3. 进行质量

    12、控制,基本原理: 许多临床检验指标,当影响某一指标的随机因素很多,而每个因素所起的作用均不太大时,这个指标的随机波动属于随机误差,则往往服从正态分布。 如果某一差异仅是由个体差异和随机误差导致的,那么观察结果服从正态分布。,质量控制图,质量控制图1,质量控制图2,目前推崇的接近零不合格过程的有效控制: 实现六西格玛质量控制,判断异常的8种情况是: 有1个点距中心线的距离超过控制线; 在中心线的一侧连续有9个点; 连续6个点稳定地增加或减少; 连续14个点交替上下; 连续3个点中有2个点在警戒线外; 连续5个点中有4个点距中心线距离超过1个标准差 中心线一侧或两侧连续15个点距中心线距离超出都在

    13、1个标准差以内; 中心线一侧或两侧连续8个点距中心线距离超出都超出1个标准差范围。,4. 正态分布是许多统计方法的理论基础,后续课的内容许多方法,都是以正态分布的原理来分析的。t 分布、 分布和F分布等都是正态分布基础上推演过来。 许多非正态分布的资料, 当观察例数足够多时, 也趋于正态分布, 可用近似正态原理来分析, 也可将一些非正态分布的资料转化为正态分布来处理。,3.1.4 正态分布的判断,如何判断一组数据是否符合正态分布:,1. 根据文献报道 例如:文献报道中学生的体重、肺活量服从正态分布,则可沿用文献的作法对数据进行处理。 2. 根据经验或专业知识判断: 例如:根据专业知识,同性别健

    14、康成人的红细胞数、血红蛋白含量、脉搏数都近似正态分布,而正常人的血铅含量近似对数正态分布。,3. 用统计软件进行正态性检验: SPSS、SAS、EXCEL等,方法,绘制图形直接观察,专门检验方法考察,1.“直方图”或“茎叶图” 2.“P-P图”或“Q-Q图”,“直方图”或“茎叶图”: 可直接地进行观察, 但不能直观地给出数据分布与正态分布相关多少的信息,2. “P-P图”或“Q-Q图”地:直观地表示数据是否符合所考察的正态分布:,P-P图:比较变量的实际累积概率和正态分布的理论累 积概率的符合程度。,去势P-P图:分布的残差图,实际累积概率,理论累积概率,若残差的绝对值0.05,基本认为服从N

    15、(0,1),Q-Q图:根据变量的实际分位数和与理论分布进行绘图,并据此判断变量是否服从 特定的分布。,实际累积值,理论累积值,若残差的绝对值0.05,基本认为服从N(0,1),去势Q-Q图:分布的残差图,举例:100 名健康成年女子血清蛋白含量表, 试对其 进行正态性检验。,【电脑实现】SPSS,结果输出:,绘制图形直接观察:,1. 直方图,2. Q-Q图,去势Q-Q图,SPSS规定: 当n 5000 时,结果以Shapiro-Wilk (W检验)为准; 当n 5000时,结果以Kolmogorov- Smirnov (D检验) 为准,H0:呈正态分布;H1:不呈正态分布 =0.10,正态性检

    16、验:,注意: 很多统计方法的前提是变量服从正态分布,应该建立这种意识, 对变量是否服从正态分布应该通过检验确定。 在SPSS 中有很多方法可以进行正态分布的检验, 在使用中可以根据自己对SPSS 熟悉程度选择一种方法对正态分布进行检验。,正态分布图形有其明确的特征,是一典型的钟形曲线。 正态分布的两个参数是均数和标准差, 为了应用方便,常对任意一个正态分布的随机变量X作Z变换,将其转为标准正态曲线。 应用正态分布曲线下的面积分布规律,可以估计医学参考值范围,概率及进行质控等,正态分布是一种重要的连续型变量分布形式。,小 结,选择题:,2.正态分布曲线下右侧5对应的分位点为 A.+1.96 B.

    17、-1.96 C.+2.58 D.+1.64 E.-2.58,1.正态分布的两个参数, 对应的正态曲线平行右移 A.增大 B. 减小 C. 增大 D. 减小 E. 增大同时增大,3.正态分布的特点有: A. 算术均数=几何均数 B. 算术均数=中位数 C. 几何均数=中位数 D. 以上都没有,分析题 : 为估计某地居民尿汞值的参考值范围, 测得某地200名正常成人的尿汞值如下,试计算尿汞值的95%医学参考值范围。,思考题:,1. 如何判断一组数据是否符合正态分布? 根据文献报道 根据经验或专业知识判断 借助统计软件上的正态性检验 2. 对称分布在 范围内,也包括95%的观察值吗? 3. 如何判断

    18、一组资料是否服从Poisson分布?,计算题: 1. 某地抽查120份黄连中小蘖碱含量(mg/100g)得平均数为4.38,标准差为0.18,假设数据服从正态分布,问: (1)95%黄连样品中小蘖碱含量在什么范围? (2)有一份黄连样品,小蘖碱含量为4.80,怎样评价?,答案:,根据公式,另:(4.8-4.38)/0.18=2.331.96,所以可认为小蘖碱含量不正常。,2. 某地1998年抽样调查了100名18岁男大学生身高,其均数=172.70cm,标准差= 4.01 cm。 (1) 估计该地18岁男大学生身高在168 cm以下者占该地18岁男大学生总数的百分数; (2) 估计该地18岁男

    19、大学生身高在177 cm以下者占该地18岁男大学生总数的百分数。,答案:,查附表得, (u)=0.1210,即该地18岁男大学生身高在168 cm以下者占该地18岁男大学生总数的12.10%。,查附表得, (-1.07)=0.1423, 则 (u)=1- (-1.07)=1-0.1423=0.8577 即该地18岁男大学生身高在177 cm以下者占该地18岁男大学生总数的85.77%。,3. 已知某地正常成年女子的血清总蛋白数服从正态分布,调查了该地110名正常成年女子,得样本血清总蛋白均数为72.8g/L,标准差为3.8g/L,试估计该地正常成年女子血清总蛋白介于66.0 75.0 g/L之间的比例,及110名正常成年女子中血清总蛋白介于66.075.0 g/L之间的人数。,答:大样本,可将样本均数、标准差 S 作为总体、 的估计值,即将其血清总蛋白数近似看作服从N(72.8, 3.82)的正态分布。 1. 将变量作如下标准化变换:,2. 查 u 值表得:,THANK YOU!,

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:医科大学精品课件:概率分布(研).ppt
    链接地址:https://www.163wenku.com/p-443991.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库