科研设计的统计学原则课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《科研设计的统计学原则课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科研 设计 统计学 原则 课件
- 资源描述:
-
1、科研设计的统计学原则科研设计的统计学原则高月求高月求实验设计实验设计 实验(实验(Experiment)指由研究者主动地决定给予)指由研究者主动地决定给予部分实验对象某种处理,给予另一部分对象某种部分实验对象某种处理,给予另一部分对象某种对照处理的研究设计形式,这种处理的分配常常对照处理的研究设计形式,这种处理的分配常常是随机的。是随机的。实验设计(实验设计(Experimental design)是通过对象)是通过对象的选择、处理因素的合理分配、结果指标的准确的选择、处理因素的合理分配、结果指标的准确测量和恰当的资料分析来提高组与组间非处理因测量和恰当的资料分析来提高组与组间非处理因素的一致
2、性,使实验结果有较好的可比性,并且素的一致性,使实验结果有较好的可比性,并且较好地控制误差,用较小的样本获取可靠的结论。较好地控制误差,用较小的样本获取可靠的结论。实验设计三要素实验设计三要素 处理处理 对象对象 效应效应 降压药降压药 高血压病人高血压病人 血压值血压值处理处理 处理(处理(treatment):研究者根据研究目的):研究者根据研究目的欲施加或欲观察的,能作用于受试对象并欲施加或欲观察的,能作用于受试对象并引起效应的因素。引起效应的因素。非处理因素:相应的也能使受试对象产生非处理因素:相应的也能使受试对象产生效应的因素,又称混杂因素效应的因素,又称混杂因素(confoundi
3、ng factor)。处理因素要标准化,处理水平始终一致。处理因素要标准化,处理水平始终一致。对象对象(subjects)指根据研究目的确定的观察对象(动物或指根据研究目的确定的观察对象(动物或人体),必须具备同质性和代表性人体),必须具备同质性和代表性 1)动物的选择:种类、品系、年龄、性别、)动物的选择:种类、品系、年龄、性别、体重、营养体重、营养 2)人的选择:诊断明确、依从性好,反映)人的选择:诊断明确、依从性好,反映主观感觉主观感觉效应效应(effect)是处理因素作用于受试对象的反应和结果,通过观察指标表是处理因素作用于受试对象的反应和结果,通过观察指标表达。指标要求:达。指标要求
4、:1)客观性:主观指标和客观指标。)客观性:主观指标和客观指标。2)精确性:)精确性:准确度准确度(accuracy):观察值与真值的接近程度,受系:观察值与真值的接近程度,受系统误差的影响。统误差的影响。精密度精密度(precision):重复观察时观察值与其均值的接:重复观察时观察值与其均值的接近程度,受随机误差的影响;近程度,受随机误差的影响;3)灵敏性)灵敏性(sensitivity):表示指标检出真阳性的能力,可:表示指标检出真阳性的能力,可减少假阴性率。减少假阴性率。4)特异性)特异性(specificity):表示指标检出真阴性的能力,减表示指标检出真阴性的能力,减少假阳性率。少
5、假阳性率。实验误差及其特点实验误差及其特点 在实验中,由于实验对象自身特点、实验在实验中,由于实验对象自身特点、实验条件的变化和实验结果测量的不确定性造条件的变化和实验结果测量的不确定性造成实验结果与真值的差别称实验误差成实验结果与真值的差别称实验误差(Experimental error)。根据统计分析上)。根据统计分析上的处理不同,实验误差分成两类:的处理不同,实验误差分成两类:随机误差(随机误差(Random error)非随机误差非随机误差 随机误差(随机误差(Random error)随机误差是由大量的、微小的、偶然因素随机误差是由大量的、微小的、偶然因素引起的不易控制的误差。如在实
6、验中,温引起的不易控制的误差。如在实验中,温度、湿度、风向、振动、试剂、仪器、操度、湿度、风向、振动、试剂、仪器、操作员等都可能造成结果的偏差。作员等都可能造成结果的偏差。随机变异是没有倾向性的,在大量观察条随机变异是没有倾向性的,在大量观察条件下,随机误差的分布呈标准正态分布。件下,随机误差的分布呈标准正态分布。随机误差的规律可以用统计方法分析。随机误差的规律可以用统计方法分析。非随机误差非随机误差 又称偏倚(又称偏倚(bias)或系统误差()或系统误差(Systematic error)由于在对象选择、处理因素分配的不随机、测量结果的不由于在对象选择、处理因素分配的不随机、测量结果的不准确
7、造成实验结果有倾向性地偏离称之。(无统计规律、准确造成实验结果有倾向性地偏离称之。(无统计规律、可预防、务必控制)可预防、务必控制)(1)选择偏倚选择偏倚(Selection bias):指在选择研究对象和分组:指在选择研究对象和分组时的非随机化,造成结果的偏倚。如肝癌手术治疗与化疗时的非随机化,造成结果的偏倚。如肝癌手术治疗与化疗的疗效比较中,由于手术对象的选择性造成有利于手术组的疗效比较中,由于手术对象的选择性造成有利于手术组的结果。的结果。(2)信息偏倚(信息偏倚(Information bias):指测量方面的误差,):指测量方面的误差,特别是主观因素造成的有倾向性的偏倚。如在临床试验
8、中,特别是主观因素造成的有倾向性的偏倚。如在临床试验中,实验组是在医院测量,对照组是在家中测量。实验组是在医院测量,对照组是在家中测量。(3)混杂偏倚(混杂偏倚(Confounding):指实验组与对照组在一):指实验组与对照组在一些影响实验结果的非处理因素不均衡造成结果的偏倚。如些影响实验结果的非处理因素不均衡造成结果的偏倚。如病情轻重、并发症、辅助治疗和护理等因素不均衡。病情轻重、并发症、辅助治疗和护理等因素不均衡。实验设计的原则实验设计的原则 对照(对照(Control)随机化(随机化(Randomization)重复(重复(Replication)盲法(盲法(blind method)
9、对照(对照(Control)指设立对照组以排除非处理因素而显示出处理的效指设立对照组以排除非处理因素而显示出处理的效应。应。处理组处理组 处理因素处理因素+非处理因素非处理因素=处理和非处理的效应处理和非处理的效应对照组对照组 非处理因素非处理因素=非处理因素的效应非处理因素的效应对比对比 处理因素处理因素 =处理效应处理效应 对照组设置的三个条件:对照组设置的三个条件:对等:除处理因素外,两组对等的非处理因素对等:除处理因素外,两组对等的非处理因素 同步:两组始终处于同一空间和同一时间同步:两组始终处于同一空间和同一时间 专设:对照组专门设立,一般不能以文献为对照专设:对照组专门设立,一般不
10、能以文献为对照(有时可与(有时可与“常模常模”比较)比较)随机化(随机化(Randomization)随机原则是指随机原则是指“机会均等机会均等”,最简单的方,最简单的方法是抽签法是抽签 随机随机随便,任何随便都不是随机的随便,任何随便都不是随机的 随机化类型随机化类型 随机抽样:每个个体有同等的机会被抽中随机抽样:每个个体有同等的机会被抽中 分组随机:每个实验对象分配到不同处理分组随机:每个实验对象分配到不同处理组的机会相同组的机会相同 随机顺序:每个实验对象接受处理先后的随机顺序:每个实验对象接受处理先后的机会相同机会相同重复(重复(Replication)重复是指在相同实验条件下进行多次
11、研究重复是指在相同实验条件下进行多次研究或多次观察,以提高实验的可靠性与科学或多次观察,以提高实验的可靠性与科学性。性。广义地讲,重复包括:整个实验的重复、广义地讲,重复包括:整个实验的重复、用多个实验单位进行重复、同一实验单位用多个实验单位进行重复、同一实验单位的重复观察。的重复观察。决定重复性的关键是样本含量,故常将重决定重复性的关键是样本含量,故常将重复性简化为复性简化为“样本含量样本含量”盲法(盲法(blind method)按实验方案规定,尽量不让参与临床实验的受试按实验方案规定,尽量不让参与临床实验的受试者、研究者、医务人员、监视员、数据管理和统者、研究者、医务人员、监视员、数据管
12、理和统计分析人员知道患者接受何种治疗。计分析人员知道患者接受何种治疗。单盲法(单盲法(single blind)指受试者不知道自己属于)指受试者不知道自己属于试验组还是对照组试验组还是对照组 双盲法(双盲法(double blind)指受试者和试验医务人)指受试者和试验医务人员都不知道病人属于试验组还是对照组员都不知道病人属于试验组还是对照组 非盲法非盲法(open label):采用单盲或非盲法试验应在采用单盲或非盲法试验应在研究方案中申述理由。研究方案中申述理由。盲法的原则应自始至终地贯彻于整个试验之中盲法的原则应自始至终地贯彻于整个试验之中 针对研究类型选择适当的研究设计 类型目的首选的
13、研究设计治疗研究检验各种干预措施如药物治疗、介入或外科手术的效果随机对照临床试验诊断研究评估新的诊断方法的有效性和可行性横断面调查(须同时进行新方法和金标准方法检验)预后研究了解确诊病人以后可能发生的情况纵向队列研究因果关系研究评估有害因素与疾病发生是否有关队列研究或病例-对照研究,病例报告亦有用筛选研究评估适于大规模人群检验和在疾病呈现症状早期检出该病的各种检查方法横断面调查随机对照临床试验(RCT)n适用RCT解决的临床问题 对某一疾病,研究药物在效果上是否优于安慰剂或另一种药物(对照药)?新的手术方法是否优于传统方法?改变生活习惯是否会影响病人血压水平?RCT的优点n在选定的病人组群中,
14、可严格评价单一变量的效果n前瞻性设计n应用假设推导进行推理n消除偏倚:比较基线指标相同的两个组n可作荟萃分析和系统性评价 RCT被认为是临床科研的“金标准”RCT的缺点n 耗费又耗时:无法完成、样本量不足、研究时间太短n 多数由研究机构或药厂(公司)资助,难免不会影响公正n 常使用“替代终点”n 可出现“潜在的偏倚”随机化不完善 未对所有合格病人进行随机化分配 未避免资料评价人员知道病人随机情况n 其他 排除标准的偏倚 入选标准的偏倚 不适合进行RCT:n预后研究 适于纵向队列研究n筛查研究 适于横断面研究n“保健质量”研究:尚未确定“成功”标准,适于定性研究方法队列研究 选择2组,暴露于某种
15、特定物质(药物、疫苗、环境致病物等)不同的人群,随访,观察每组发生特定疾病结局或人数。研究对象为可能发病或不发病者。关注的是病因,而非疾病治疗适合采用队列研究的临床问题n吸烟导致肺癌吗?n高血压随着时间推移会变好吗?n避孕药导致“乳腺癌”吗?n早产儿在以后的生长发育和学习成绩上情况如何?病例-对照研究 确定有某种特定疾病的病人并与对照组进行匹配,收集其暴露于某种可疑致病因子的资料。关注的是病因而非疾病治疗。对于罕见病的研究可能是唯一选择。横断面调查 对某一研究对象中的代表性样本(或病人)进行访问、检查或研究以获得对某一特定临床问题的答案。资料在单一时间点收集,但可回顾性追溯过去有关健康方面的经
16、历。病例报告 以故事方式描述单一患者病史。可综合形成病例系列,以描述一个以上患有某一特殊情况患者的病史,阐述此种情况的某个方面、治疗情况或对治疗之不良反应。病例报告之优点n可以传递大量在临床试验中或调查中可能丢失的信息n易被普通医师或大众理解n易于完成(数天内)统计工作的步骤统计工作的步骤 第一步设计(design):第二步收集资料(collection of data):第三步整理资料(sorting data):第四步分析资料(analysis of data):设计(设计(design)首先明确研究目的首先明确研究目的,根据研究目的,从统计角度对资料的根据研究目的,从统计角度对资料的搜集
17、、整理和分析全过程提出全面具体的计划和要求,作搜集、整理和分析全过程提出全面具体的计划和要求,作为统计工作实施的依据,以便用尽可能少的人力、物力和为统计工作实施的依据,以便用尽可能少的人力、物力和时间获得准确可靠的结论。时间获得准确可靠的结论。1、明确对象、明确对象 2、明确取得原始资料的方法、明确取得原始资料的方法 3、如何整理资料、如何整理资料 4、计算哪些指标、计算哪些指标 5、用何种统计推断方法、用何种统计推断方法 6、预测结果、预测结果搜集资料搜集资料 搜集及时、准确、完整地搜集原始资料是统计工搜集及时、准确、完整地搜集原始资料是统计工作最重要的一步,它直接关系着统计结论的质量。作最
18、重要的一步,它直接关系着统计结论的质量。统计资料的来源主要有:统计资料的来源主要有:1、报表资料。、报表资料。2、医疗、预防机构的日常工作记录。、医疗、预防机构的日常工作记录。3、专题研究实验数据和现场调查资料。、专题研究实验数据和现场调查资料。整理资料(整理资料(sorting of data)整理资料又称统计归纳:是把搜集到的资整理资料又称统计归纳:是把搜集到的资料进行适当的分组,把性质相同的资料归料进行适当的分组,把性质相同的资料归纳到一起,用表格或图形的方式展示出来,纳到一起,用表格或图形的方式展示出来,以反映研究对象的规律性。以反映研究对象的规律性。1、审核资料、审核资料 2、设计分
19、组:质量分组和数量分组、设计分组:质量分组和数量分组 3、拟整理表、拟整理表 4、归纳汇总、归纳汇总分析资料分析资料 分析资料资料的分析过程是通过计算有关的统计分析资料资料的分析过程是通过计算有关的统计指标,对资料进行概括的、全面的描述,以及从指标,对资料进行概括的、全面的描述,以及从样本信息推断总体特征,分析资料就是从获取的样本信息推断总体特征,分析资料就是从获取的资料中抽取有关信息的过程。资料中抽取有关信息的过程。1、统计指标的计算、统计指标的计算 2、统计图表的绘制、统计图表的绘制 3、估计总体参数、估计总体参数 4、进行假设检验、进行假设检验 5、回归与相关、回归与相关 6、多元分析、
20、多元分析统计资料的类型统计资料的类型v 计量资料计量资料 v 计数资料计数资料v 等级资料等级资料 计量资料(计量资料(measurement data)measurement data)通过对观察单位测量取得数值,其值一般有度量衡单位。如身高、体重、血压、脉搏、白细胞空气中二氧化碳含量等。此类资料具有计量单位,各观察单位常有量的差别。分析计量资料常用平均数、标准差、t检验、方差分析、相关与回归分析等。计数资料计数资料(enumeration data)(enumeration data)将观察单位按某种属性或类别分组,然后清点各组的观察单位数。如性别、血型、民族、职称、某病的治愈和未愈数等。
21、分属于各组的观察单位间有质的差别,不同质的观察单位不能归在同一组内。分析计数资料常用率、构成比、x2检验等。将观察单位按某种属性的不同程度分组,然后清点各组的观察单位数。如疗效可分为治愈、显效、好转、无效;尿蛋白化验结果分为-、+、+、+等。这类资料具有计数资料的性质,但所分各组又是按一定顺序如由轻到重、由小到大排列的。分析等级资料常用率、构成比、秩和检验等。等级资料等级资料 (ranked data)ranked data)医学统计中的几个基本概念医学统计中的几个基本概念 数据与变量 总体和样本 随机化 统计量与参数 抽样误差 概率 变量(variable)具有变异性的数据称为变量。1数值变
22、量(numerical variable):为连续变量,如身高、体重、血压等。数值变量均可通过对观察单位测量取得数值,其值一般有度量衡单位。数值变量资料也称作计量资料。2分类变量(categorical variable):可能取值是离散的,表现为互不相容的类别。比如性别、血型、民族、职称等。分类变量资料又称为计数资料。分类变量有两种:无序分类变量和有序分类变量 总体与样本总体与样本 总体(population):是根据研究目的确定的同质的观察单位的某个变量值的全体。分有限总体和无限总体。样本(sample):通常是从总体中随机抽取有代表性的一部分观察单位。注意其代表性 和可靠性。抽样误差抽样
23、误差(sampling errorsampling error)用于描述样本特征的指标称为统计量,而用于描述总体特征的指标称为参数。我们把由随机抽样引起的样本指标与总体指标的差异称为抽样误差。由于个体变异的普遍存在,抽样误差是不可避免的。只要遵循随机化的原则,抽样误差的大小就可以用统计方法进行估计。一般情况下样本越大,抽样误差越小,反映事物客观规律的准确性越高,反之,样本越小,抽样误差越大。概率(概率(probability)描述随机事件发生的可能性大小的数值称概率。随机事件的概率随机事件的概率P取值在取值在0 1之间,之间,P越接近越接近1,说明某事,说明某事件发生的可能性越大;件发生的可能
24、性越大;P越接近越接近0,说明某事件发生的可能性,说明某事件发生的可能性越小。越小。如果某事件的概率如果某事件的概率P=0,表示该事件不可能发生,称其为,表示该事件不可能发生,称其为不可能事件;如果不可能事件;如果P=1,表示该事件必然发生,称其为必然,表示该事件必然发生,称其为必然事件。事件。随机事件是可能发生也可能不发生的事件。如果某随机随机事件是可能发生也可能不发生的事件。如果某随机事件发生的概率事件发生的概率P0.05,或,或P0.01表示该事件发生的可能表示该事件发生的可能性很小,我们称其为小概率事件。其意义为在一次试验中不性很小,我们称其为小概率事件。其意义为在一次试验中不发生事件
25、。发生事件。数值变量资料的统计描述数值变量资料的统计描述 统计图表统计图表 统计指标统计指标 平均数平均数v 均数v 几何均数v 中位数和百分数均数均数(meanmean)均数是算术平均数均数是算术平均数 (arithmetic mean)(arithmetic mean)的简的简称。总体均数用希腊字母称。总体均数用希腊字母()表示,样本均数表示,样本均数用用()表示。表示。1 1、应用条件、应用条件:均数反映同质的一组观察:均数反映同质的一组观察值在数量上的平均水平,样本所代表总体为正值在数量上的平均水平,样本所代表总体为正态分布。态分布。x2 2、计算方法:、计算方法:(1)直接法直接法
展开阅读全文