科研数据的分析与处理-课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《科研数据的分析与处理-课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 科研 数据 分析 处理 课件
- 资源描述:
-
1、李志春李志春新乡医学院公共卫生学院新乡医学院公共卫生学院医学科研数据的整理与分析医学科研数据的整理与分析第一节第一节 科研数据的检查与整理科研数据的检查与整理第二节第二节 科研数据的描述科研数据的描述第三节第三节 统计分析方法的选择统计分析方法的选择第四节第四节 科研数据的综合分析科研数据的综合分析第五节第五节 统计分析结果的解释与表达统计分析结果的解释与表达一、对象的检查一、对象的检查二、缺项与差错二、缺项与差错三、资料的整理三、资料的整理第一节第一节 科研数据的检查与整理科研数据的检查与整理一一、对象的检查对象的检查 首先要鉴别所调查或研究的个体是否属于所规首先要鉴别所调查或研究的个体是否
2、属于所规定的调查对象或研究对象。定的调查对象或研究对象。在进行临床研究时,要特别注意疾病诊断、分在进行临床研究时,要特别注意疾病诊断、分类的正确性,这对于保证研究结果的正确性是十分类的正确性,这对于保证研究结果的正确性是十分必要的。必要的。由于多种原因在一些调查表中经常可以见到缺由于多种原因在一些调查表中经常可以见到缺项的存在,缺项的存在严重地影响到资料的完整性。项的存在,缺项的存在严重地影响到资料的完整性。通过检查发现研究资料中的差错也是十分必要通过检查发现研究资料中的差错也是十分必要的,应对研究数据作认真的检查。的,应对研究数据作认真的检查。二二、缺项与差错检查缺项与差错检查 专业检查专业
3、检查 统计检查统计检查二二、缺项与差错检查缺项与差错检查 人工检查人工检查 计算机检查计算机检查二二、缺项与差错检查缺项与差错检查在周密实验设计指导下获得的实验数据,不应在周密实验设计指导下获得的实验数据,不应随意舍弃,否则实验结果的真实性与完整性就会受随意舍弃,否则实验结果的真实性与完整性就会受到破坏。到破坏。可疑数据的处理可疑数据的处理X3020100-10Y3020100-10在该数据指标服从正态分布的前提下,可用统计在该数据指标服从正态分布的前提下,可用统计方法检查个别方法检查个别“可疑值可疑值”是否应当舍弃。是否应当舍弃。当当n n1010时,可以时,可以用用“”作为舍弃可疑值作为舍
4、弃可疑值的准则。的准则。当当n n1010时,可以采用时,可以采用Q Q检验法、检验法、DixonDixon检验法或检验法或GrubbsGrubbs检验法,进行测量值的一致性检验,从而判检验法,进行测量值的一致性检验,从而判断是否剔除可疑值。断是否剔除可疑值。可疑数据的处理可疑数据的处理s s3 3x在对资料做好检查、核对后,就需要把杂乱无章在对资料做好检查、核对后,就需要把杂乱无章的资料条理化,以便于进行统计计算与分析,即整的资料条理化,以便于进行统计计算与分析,即整理资料。理资料。三、资料的整理三、资料的整理 数据库的选择数据库的选择 数据录入数据录入 数据核查与清理数据核查与清理 数据加
5、工(如编码、标准化、根据原始记录数据加工(如编码、标准化、根据原始记录产生新的研究变量等)产生新的研究变量等)数据最终锁定并进入分析数据最终锁定并进入分析医学科研数据的整理与分析医学科研数据的整理与分析第一节第一节 科研数据的检查与整理科研数据的检查与整理第二节第二节 科研数据的描述科研数据的描述第三节第三节 统计分析方法的选择统计分析方法的选择第四节第四节 科研数据的综合分析科研数据的综合分析第五节第五节 统计分析结果的解释与表达统计分析结果的解释与表达一、统计指标一、统计指标二、统计表二、统计表三、统计图三、统计图第二节第二节 科研数据的描述表达科研数据的描述表达(一)总量指标与相对数指标
6、(一)总量指标与相对数指标(二)平均数指标(二)平均数指标(三)变异指标(三)变异指标一、统计指标一、统计指标 统计表是用表格的方式表达统计资料和指标。统计表是用表格的方式表达统计资料和指标。在编制统计表时,应该遵循以下原则:在编制统计表时,应该遵循以下原则:1.1.重点突出,简单明了重点突出,简单明了。即一张表只包含一个中心。即一张表只包含一个中心内容,使人一目了然,不要包罗万象。内容,使人一目了然,不要包罗万象。2.2.主谓分明,层次清楚主谓分明,层次清楚。二、统计表二、统计表一、统计指标一、统计指标二、统计表二、统计表三、统计图三、统计图第二节第二节 科研数据的描述表达科研数据的描述表达
7、医学科研数据的整理与分析医学科研数据的整理与分析第一节第一节 科研数据的检查与整理科研数据的检查与整理第二节第二节 科研数据的描述科研数据的描述第三节第三节 统计分析方法的选择统计分析方法的选择第四节第四节 科研数据的综合分析科研数据的综合分析第五节第五节 统计分析结果的解释与表达统计分析结果的解释与表达(一一)假设检验假设检验(二二)区间估计区间估计(三三)变量间关系的研究变量间关系的研究(四四)判别分析判别分析一、统计分析方法概述一、统计分析方法概述包括有计量资料分布类型的假设检验、计量资料包括有计量资料分布类型的假设检验、计量资料方差的假设检验、计量资料均数的假设检验、等级方差的假设检验
8、、计量资料均数的假设检验、等级资料分布或位置的假设检验、两种属性间的独立性资料分布或位置的假设检验、两种属性间的独立性检验以及两种方法判断结果一致性的检验等。检验以及两种方法判断结果一致性的检验等。(一)假设检验概念概念:根据样本均数,按一定的可信度计算根据样本均数,按一定的可信度计算 出总体均数很可能在的一个数值范围,这个出总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间。范围称为总体均数的可信区间。方法方法:(1)u分布法分布法(2)t分布法分布法总体均数(总体均数()的)的100(1-100(1-)%)%置信区间置信区间(CI)(CI):(1)(1)已知总体标准差已知总体标
9、准差,按正态分布原理,计算公式为:,按正态分布原理,计算公式为:(2)(2)未知,未知,n n较小,按较小,按t t分布原理计算:分布原理计算:(3)(3)未知,未知,n n足够大足够大(如如n n100)100),按正态分布原理计算:,按正态分布原理计算:xsux x,stxxux 查表法查表法 当当n50时时正态近似法正态近似法 当样本含量足够大,且样本率当样本含量足够大,且样本率p和(和(1-p)均)均不太小。一般认为不太小。一般认为np和和n(1-p)5。pusp(一一)假设检验假设检验(二二)区间估计区间估计(三三)变量间关系的研究变量间关系的研究(四四)判别分析判别分析一、统计分析
10、方法概述一、统计分析方法概述1.1.各指标之间无自变量与因变量之分各指标之间无自变量与因变量之分(1 1)研究变量之间的相互关系有研究变量之间的相互关系有直线相关分析、典直线相关分析、典型相关分析型相关分析等。等。(2 2)研究多个变量的内部从属关系,并寻找综合指研究多个变量的内部从属关系,并寻找综合指标,降低变量的维数,其常用的方法主要有标,降低变量的维数,其常用的方法主要有主成分主成分分析、因子分析分析、因子分析和和对应分析对应分析。(3 3)研究多个变量内部或多个样品之间的亲疏关系研究多个变量内部或多个样品之间的亲疏关系有有聚类分析聚类分析。(4 4)研究多个变量内部的各种复杂关系有线性
11、结构研究多个变量内部的各种复杂关系有线性结构方程的方程的协方差分析协方差分析。(三)变量间关系的研究2.2.各指标之间有自变量与因变量之分各指标之间有自变量与因变量之分 研究变量之间研究变量之间的依存关系有的依存关系有直线回归分析直线回归分析、曲线回归分析曲线回归分析、多项多项式回归分析式回归分析、多元线性回归分析多元线性回归分析、概率模型回归分概率模型回归分析析、生存资料的、生存资料的参数模型回归分析参数模型回归分析、COXCOX模型回归分模型回归分析析和和对数线性模型分析对数线性模型分析。(三)变量间关系的研究(一一)假设检验假设检验(二二)区间估计区间估计(三三)变量间关系的研究变量间关
12、系的研究(四四)判别分析判别分析 根据一些明确分类的总体所提供的信根据一些明确分类的总体所提供的信息,对未知个体的归属进行分类的判别分析。息,对未知个体的归属进行分类的判别分析。一、统计分析方法概述一、统计分析方法概述 分析目的分析目的 资料类型资料类型 设计方案设计方案 数理统计条件数理统计条件选择统计分析方法需考虑的因素选择统计分析方法需考虑的因素二、计量资料假设检验方法的选择二、计量资料假设检验方法的选择首先要明确每次拟分析的定性变量个数是多少?首先要明确每次拟分析的定性变量个数是多少?其次要弄清定性变量的属性、列联表中频数的多少其次要弄清定性变量的属性、列联表中频数的多少以及资料的收集
13、方式。以及资料的收集方式。三、计数资料假设检验方法的选择三、计数资料假设检验方法的选择每次只分析两个变量时,可将资料整理为每次只分析两个变量时,可将资料整理为2 22 2表、表、2 2k k表和表和R RC C表的形式。表的形式。常用的统计分析方法有常用的统计分析方法有Pearson Pearson 2 2检验、校正检验、校正2 2检验、配对计数资料的检验、配对计数资料的McNemar McNemar 2 2检验、检验、FisherFisher精确概率法检验、秩和检精确概率法检验、秩和检验、验、RiditRidit分析、等级相关分析、典型相关分析、一分析、等级相关分析、典型相关分析、一般趋势和
14、线性趋势检验、般趋势和线性趋势检验、KappaKappa检验等;检验等;如果需要同时分析研究的定性变量的个数如果需要同时分析研究的定性变量的个数33时,时,常用的统计分析方法有加权常用的统计分析方法有加权2 2检验、检验、Mantel-Mantel-haenszel haenszel 2 2检验、检验、logisticlogistic回归模型和对数线性模回归模型和对数线性模型等。型等。在计数资料的分析过程中,对于在计数资料的分析过程中,对于R RC C表形式资料表形式资料的分析是一个难点,存在的问题比较多。的分析是一个难点,存在的问题比较多。根据二维列联表中两个分组变量的类型以及分析根据二维列
15、联表中两个分组变量的类型以及分析的目的,对的目的,对R RC C表资料进行分类,因为不同类型的表资料进行分类,因为不同类型的R RC C表资料和不同的分析目的,就有不同的分析方表资料和不同的分析目的,就有不同的分析方法。法。RC表检验方法的选择表检验方法的选择双向无序双向无序R RC C表资料及其统计分析方法的选择表资料及其统计分析方法的选择单向有序单向有序R RC C表资料及其统计分析方法的选择表资料及其统计分析方法的选择双向有序且属性不同的双向有序且属性不同的R RC C表资料及其统计分析表资料及其统计分析方法的选择方法的选择双向有序且属性相同的双向有序且属性相同的R RC C表资料及其统
16、计分析表资料及其统计分析方法的选择方法的选择RC表检验方法的选择表检验方法的选择对单向有序对单向有序R RC C表的两个分组变量,其中一个是表的两个分组变量,其中一个是无序的(实验分组变量无序的(实验分组变量不同药品);另一个却不同药品);另一个却是有序的(指标分组变量是有序的(指标分组变量处理效果)。此时不处理效果)。此时不适合选用适合选用2 2检验分析资料,因为检验分析资料,因为2 2检验与检验与“疗效疗效”的有序性之间没有任何联系,故应采用与的有序性之间没有任何联系,故应采用与“有序性有序性”有联系的秩和检验或有联系的秩和检验或RiditRidit分析。分析。RC表检验方法的选择表检验方
17、法的选择对双向有序且属性不同的对双向有序且属性不同的R RC C表的两个分组变量,表的两个分组变量,如年龄组别与某种疾病发生程度都是有序的,但属如年龄组别与某种疾病发生程度都是有序的,但属性不同,此时,也不适合选用性不同,此时,也不适合选用2 2检验分析资料,因检验分析资料,因为为2 2检验与两个变量的有序性之间没有任何联系,检验与两个变量的有序性之间没有任何联系,应改用与两个变量的应改用与两个变量的“有序性有序性”有联系的有联系的等级相关等级相关分析分析、典型相关分析典型相关分析或或线性趋势检验线性趋势检验。RC表检验方法的选择表检验方法的选择对双向有序且属性相同的对双向有序且属性相同的R
展开阅读全文