医学统计学重点总结课件-2.ppt

上传人（卖家）：晟晟文业

文档编号：3810029

上传时间：2022-10-15

格式：PPT

页数：65

大小：450.99KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

28 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《医学统计学重点总结课件-2.ppt》由用户（晟晟文业）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 医学统计学重点总结课件 _2

资源描述：: 1、医学统计学综合练习三类资料(1)定量资料(quantitative data)以定量值表达每个观察单位的某项观察指标，如血脂、心率等。特点：各观察单位间只有量的差别；数据间有连续性。三类资料(2)定性资料(qualitative data)以定性方式表达每个观察单位的某项观察指标，如血型、性别等。特点：各观察单位间或者相同，或者存在质的差别；有质的差别者之间无连续性。三类资料(3)等级资料(ranked data,ordinal data)以等级表达每个观察单位的某项观察指标，如疗效分级、心功能分级等。特点：各观察单位间或者相同，或者存在质的差别；各等级间只有顺序，而无数值大小，故等级之间不可
2、度量。定量资料的描述集中趋势：算术均数几何均数中位数百分位数离散趋势:极差四分位数间距标准差、方差变异系数集中趋势指标应用注意事项算数均数：适用于单峰对称分布资料；几何均数：适合于作对数变换后单峰对称分布资料；中位数和百分位数：适用于任何分布的资料；中位数和百分位数在样本含量较少时不稳定，越靠两端越不稳定；中位数在抗极端值的影响方面，比均数具有较好的稳定性，但不如均数精确。因此，当资料适合计算均数或几何均数时，不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。6离散趋势指标应用注意事项全距：反映资料的分布范围，全距大说明数据的变异度大，适用于任何资料；四分位间距
3、：两个特定的百分位数，常用于描述不对称资料的特征；方差和标准差：常用来描述正态分布的资料；变异系数：常用于比较度量衡单位不同的两组或多组资料的变异度；比较均数相差悬殊的两组或多组资料的变异度。7正态分布 Normal distribution 德国数学家Gauss发现最早用于物理学、天文学 Gaussian distribution正态分布的特征正态分布有两个参数(parameter)，即位置参数(均数)和变异度参数(标准差)。高峰在均数处；均数两侧完全对称。正态曲线下的面积分布有一定的规律。正态分布和标准正态分布曲线下面积分布规律总结正态分布标准正态分布面积(或概率)-1.64+1.6
4、4-1.64+1.6490.00%-1.96+1.96-1.96+1.9695.00%-2.58+2.58-2.58+2.5899.00%正态分布的应用估计频数分布质量控制确定临床参考值范围参考值范围的估计方法方法双侧单侧下限单侧上限正态分布法Xus/2 Xu s Xu s 参考值范围(reference interval)(reference interval)参考值范围又称正常值范围(normal range)。什么是参考值范围：是绝大多数正常人的某观察指标所在的范围。绝大多数：90%，95%，99%等等。确定参考值范围的意义：用于判断正常与异常。“正常人”的定义：排除了影响所研究
5、的指标的疾病和有关因素的同质的人群。由抽样引起的样本统计量与总体参数间的差别。原因：个体变异抽样表现：样本统计量与总体参数间的差别不同样本统计量间的差别抽样误差是有规律的！抽样误差(sampling error)中心极限定理p 从正态总体中随机抽样，样本均数服从正态分布；p 从偏态分布的总体中随机抽样，当样本含量足够大时，样本均数也近似服从正态分布。从任意分布的总体从任意分布的总体(均数均数，标准差，标准差)中随机抽样，当样本含量逐渐增大时，中随机抽样，当样本含量逐渐增大时，样本均数的分布趋向正态分布，样本均数的分布趋向正态分布，此分布的均数为此分布的均数为，标准差为，标准差为标准误(
6、standard error)(standard error)样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。均数的标准误表示样本均数的变异度。当总体标准差未知时，用样本方差代替，前者称为理论标准误，后者称为样本标准误。xn xssn标准误与标准差（1）联系：都表示变异的大小；样本含量一定时，标准差越大，标准误越大。nSSX/标准误与标准差（2）标准差含义：一组变量值离散程度；标准差越小，均数的代表性越好；应用：估计参考值范围；与n的关系：样本含量越大，标准差越稳定，n 很大时，标准差趋向于总体标准差。标准误与标准差（3）标准误含义：样本统计量的离散程度；标准误越小，用样本均
7、数来反映总体均数越可靠；应用：计算可信区间；与n的关系：样本含量越大，均数的标准误越小，n很大时，标准误趋向于0。统计推断(statistical inference)根据样本所提供的信息，以一定的概率推断总体的性质。u 总体参数的估计 (parameter estimation)u 假设检验 (hypothesis test)区间估计(interval estimation)按一定的概率或可信度(1-)用一个区间估计总体参数所在范围，这个范围称作可信度为1-的可信区间。这种估计方法称为区间估计。理论基础：抽样分布规律假设检验的步骤：u建立假设(在假设的前提下有规律可循)；u确定检验水准(确定
8、最大允许误差)；u计算检验统计量(样本与总体有多大的偏离)；u计算概率P(该样本是否支持零假设)；u结论(根据小概率原理)。均数的假设检验p样本均数与总体均数的比较p配对设计样本均数的比较p两样本均数的比较均数的假设检验应用条件p独立性、正态性、方差齐性独立性、正态性、方差齐性方差齐性检验方差不齐时的近似 t 检验大样本时，均数比较的 u 检验I 型错误和 II 型错误实际情况假设检验的结果拒绝 H0 不拒绝 H0 H0 成立I 型错误()H0 不成立把握度(1-)II 型错误()P值的意义从 H0 总体中随机获得等于或大于现有统计量值的概率。拒绝H0时所冒的风险。界值界值tt定性资料
9、定性资料的特点离散性，变量仅取有限的几个值；资料不含有次序的信息；举例血型(A、B、O、AB)人群中某病发生与否(发生、不发生)描述指标：率相对数构成比相对比常用相对数(1)率（rate），又称频率指标，说明某现象发生的频率和强度。（强度相对数）实际发生某现象的观察单位数率比例基数可能发生某现象的观察单位总数常用相对数(2)构成比(proportion)，又称构成指标，说明一种事物内部各组成部分所占的比重或分布。各部分构成比之和为1或100%100观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比常用相对数(3)比（ratio），又称相对比，是A，B两个有关指标之比，说
10、明A为B的若干倍或百分之几。两个指标可以性质相同，也可以不同。BA比四格表(fourfold table)的概念这四个格子的频数是整个表的基本数据，其余数据都是从这四个基本数据推算出来的，这种资料称为四格表资料。abcd2检验的基本思想如果H0假设成立，则实际频数(actual frequency)与理论频数应该比较接近。如果实际频数与理论频数相差较大，超出了抽样误差所能解释的范围，则可以认为H0假设不成立，即两样本对应的总体率不等。理论频数的计算RCRCn nTN4310534016568326109 实际数理论频数40.3612.6442.6411.36T11=53 83/109=4
11、0.36T12=53 26/109=12.64T21=56 83/109=42.64T22=56 26/109=13.36等级资料的特点既非呈连续分布的定量资料，也非仅按性质归属于独立的若干类的定性资料；比“定量”粗，而比一般的“定性”细；等级间既非等距，亦不能度量。秩次与秩和秩次(rank)，秩统计量是指全部观察值按某种顺序排列的位序；秩和(rank sum)同组秩次之和。两样本比较的秩和检验（基本原理）Wilcoxon符号秩和检验（基本原理）秩和检验的正确应用秩和检验可用于任意分布的资料；（1）等级资料；（2）计量资料中：极度偏态资料，或个别数值偏离过大各组离散度相差悬殊资料中含有不
12、确定值大于5年、0.001、1:1024以上分布类型尚未确知（3）兼有等级和定量性质的资料相关与回归线性相关等级相关列联相关线性回归相关系数的性质-1 r 1 r0为正相关 r0为负相关 r0为零相关或无相关相关系数绝对值越大，两变量间相关程度越密切；相关系数越接近于0，表示相关越不密切。3.回归系数和回归方程的意义及性质回归系数和回归方程的意义及性质 b 的意义 a 的意义的意义的意义意义bXaY niiiYY12 YY Xs剩回总SSSSSS 剩回总总回归决定系数SSSSr 2 SSSSMSFMS回归回归回归剩余剩余剩余Fttbr 直线回归与直线相关的区别与联系联系
13、均表示线性关系；符号相同：共变方向一致；假设检验结果相同：是否存在共变关系；总回SSSSrbbrllrblllrllbyxxyxxyyyyxxxyxxxy 2.,直线回归与直线相关的区别与联系区别r 没有单位，b有单位；所以，相关系数与单位无关，回归系数与单位有关；相关表示相互关系；回归表示依存关系；对资料的要求不同：当X和Y都是随机的，可以进行相关和回归分析；当Y是随机的(X是控制的)，理论上只能作回归而不能作相关分析；实验研究的基本要素处理因素：作用于受试对象，要求在实验过程中观察其处理的因素受试对象：处理因素作用的对象实验效应：受试对象接受试验处理后所出现的实验结果实验设计的基本
14、原则基本原则之一：对照排除“非处理因素”的影响，从而衬托处理因素的作用基本原则之二：随机不仅能控制已知的混杂因素(非研究因素)，而且还能控制未知的混杂因素。是保证非处理因素在各对照组之间均衡一致的重要条件抽样随机；分组随机；试验顺序随机基本原则之三：重复以提高实验的可靠性研究设计的常见类型完全随机分组设计成组设计配对设计（目的？）正确选择分析方法考试题型选择名词解释简答题资料分析题习题1关于正态分布的特征，下面说法错误的是：A高峰位置在均数=处 B为位置参数，越大，则曲线沿横轴向右移动；越小，曲线沿横轴向左移动C为形态参数，表示数据的离散程度，若小，则曲线形态“矮胖
15、”；大，则曲线形态“瘦高”D正态分布以均数为中心，左右完全对称2.各观察值均加上同一数后，（）（A）均数不变，标准差改变（B）均数改变，标准差不变（C）两者均改变（D）两者均不变3.某地5人接种某疫苗后抗体滴度为1:20、1:40、1:80、1:16 0、1:320。为求平均抗体滴度，最好选用（）（A）中位数（B）几何均数（C）算术平均数（D）标准差4正态分布曲线下，横轴上从均数到（+1.96）的面积为：A95%B45%C47.5%D90%5.某人群血糖的正常值范围是指 ()（A）该指标在所有人中的波动范围（B）该指标在所有正常人中的波动范围（C）该指标在绝大部分正常人中的波动范围（D）
16、该指标在一个人不同时间的波动范围6假设检验中的第一类错误是指A拒绝了实际上成立的H0 B不拒绝实际上成立的H0C拒绝了实际上不成立的H0 D不拒绝实际上不成立的H07.X2.58s包括变量值的A.68.3%B.90.0%C.95.0%D.99.0%8.均数与标准差之间的关系是A.标准差越小，均数代表性越好 B.标准差越小，均数代表性越差C.均数越大，标准差越小 D.均数越大，标准差越大9.分析定性资料时，最常用的显著性检验方法是 A.t检验 B.正态检验 C.U检验 D.2检验10.四格表如有一个实际数为0A.就不能做2检验；B.就不能用校正2检验；C.还不能决定是否可做2检验；D.肯定可做校
17、正2检验。名词解释总体和样本参数和样本统计量抽样误差标准误小概率原理小概率事件P值的含义检验效能一类错误与二类错误可信区间相关系数简答题 1.简述中心极限定理的涵义？2.描述定量资料的集中位置和离散趋势各有哪些指标？3.标准差与标准误区别与联系？适用于何种情况？4.参考值范围和区间估计的区别与联系？5.假设检验的步骤有哪些?6.ANOVA的应用条件是什么？当资料不符合方差齐性条件时，需对资料进行变换，常见的变换形式有？7.秩和检验的条件？8.直线回归与直线相关的区别与联系 9.简述实验设计的基本要素，基本原则。资料分析题-1为了考察出生时男婴是否比女婴重，研究者从加州大学伯克利分校（UC Be
18、rkley）的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料（单位：磅）男婴x17.37.9 7.98.09.37.86.57.66.68.46.77.5女婴x27.17.9 6.46.68.06.07.26.87.85.36.67.3（1）该资料是数值变量资料还是分类资料？（2）要比较白种人男性与女性的出生体重是否不同，应当选用成组t检验还是配对t检验？（3）经过计算t值为2.16，已知自由度为22时，双侧面积0.05对应的t界值为2.07，自由度为11时，双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。资料分析题-2 11名志愿者接受胆固醇
19、试验，受试者在用药前后各测量一次血清胆固醇（mmol/l）数据如下，试判断此药是否有效？前6.11，6.81，6.48，7.59，6.42，6.94，9.17，7.33，6.94，7.67，8.15后 6.00，6.83，6.49，7.28，6.30，6.64，8.42，7.00，6.58，7.22，6.571.该资料属于什么研究类型？2.写出该假设检验的假设？3.若算得到t=2.8518，查表知自由度为10时，双侧面积0.05对应的t界值为2.228，自由度为20时，双侧面积0.05对应的t界值为2.086，请问如何下统计结论？现有43例栓塞性脉管炎病人，用甲、乙两种疗法治疗，治疗结果如下（
20、1）请计算最小理论数（2）若要比较甲乙疗法的治愈率是否相等，请问使用何种方法？（3）若计算得到2=4.33,校正以后的2=2.94，请问如何下统计学结论？（）分组例数治愈人数甲疗法乙疗法152811020.05,13.84资料分析题-3资料分析题-4 比较缺氧条件下猫和兔的生存时间（时间：分）猫兔生存时间秩次生存时间秩次255.51413410152381116340121844113255.542142674515288309 该资料属于什么试验设计方式？对资料进行编秩；该资料总秩和为多少？各组的实际秩和各为多少？写出对该资料进行假设检验的假设。用离子交换法和蒸馏法分别测定8名健康人的尿汞，
21、结果如下。问两法测量结果有无差别？编号离子交换法蒸馏法差值秩次10.50.00.5222.21.11.1530.00.00.042.31.31.0456.23.42.8661.04.6-3.6-771.81.10.7384.44.6-0.2-1资料分析题-5 该资料来自于什么试验设计？对该资料进行编秩，以便进行统计分析。请写出对两法测量结果有无差异之假设检验的假设假设。若H0成立，正秩和和负秩和的理论值应为多少？已知n=7时，双侧0.05对应的T界值为2-26。请写出假设检验的结论。(1)与间是否存在直线相关关系？如果存在，直线相关系数为？(根据Stata 输出结果写出假设检验的详细分析步骤，并下结论)(2)将上述Stata 结果中的方差分析表补充完整。(3)写出回归方程。该方程的假设检验结果如何？(4)X=800g 时，Y 的估计是多少？表示什么意思？(5)该回归方程的剩余标准差和决定系数各为多少？各说明什么含义？

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：医学统计学重点总结课件-2.ppt
链接地址：https://www.163wenku.com/p-3810029.html

晟晟文业

内容提供者

实名认证

联系作者