卫生统计学绪论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《卫生统计学绪论课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卫生 统计学 绪论 课件
- 资源描述:
-
1、卫生统计学卫生统计学刘金辉刘金辉宝坻区疾病预防控制中心宝坻区疾病预防控制中心 第一章 绪 论统计学统计学概念:概念:统计学是处理数据中统计学是处理数据中变异性变异性的科学与的科学与 艺术,内容包括数据的艺术,内容包括数据的收集收集、分析分析、解释解释和和表达表达,目的是求得,目的是求得可靠的结果可靠的结果。以往教材以往教材中概念:是研究数据的中概念:是研究数据的收集收集、整整 理理、分析分析和和推断推断的一门科学。的一门科学。第一节第一节 概述概述 根据根据研究领域研究领域和和研究对象研究对象的不同,统的不同,统计学又分为:数理统计、经济统计、生物计学又分为:数理统计、经济统计、生物统计、卫生
2、统计、医学统计统计、卫生统计、医学统计医学统计学(医学统计学(medical statistics):用统计学:用统计学的原理和方法研究医学中的问题。的原理和方法研究医学中的问题。卫生统计学(卫生统计学(health statistics):与医学统:与医学统计学基本相同,但更侧重于计学基本相同,但更侧重于社会社会、人群人群的卫生的卫生问题。问题。1.1.采用统计学方法,发现采用统计学方法,发现不确定不确定现象背后隐藏的规律现象背后隐藏的规律。变异变异是个体间存在的差异,是绝对的,是个体间存在的差异,是绝对的,是社会和生物医学中的普遍现象。是社会和生物医学中的普遍现象。变异使得实验或观察的结果
3、具有变异使得实验或观察的结果具有不确定不确定性性,如每个人的身高、体重、血压等各有不,如每个人的身高、体重、血压等各有不同。同。为什么要学习统计学?为什么要学习统计学?最大值=6.18,最小值=3.29,极差=2.892.用统计学思维方式考虑有关医学研用统计学思维方式考虑有关医学研究中的问题究中的问题 “阳性阳性”结果是否是虚假联系?结果是否是虚假联系?某感冒药治疗某感冒药治疗1周后,治愈率为周后,治愈率为90%,能否说该感冒药十,能否说该感冒药十分有效?分有效?“阴性阴性”结果是否是样本含量不足?结果是否是样本含量不足?有人曾对发表在有人曾对发表在Lancet,N Engl J Med,JA
4、MA等著名医等著名医学杂志上的学杂志上的71篇阴性结果的论文作过分析,发现其中有篇阴性结果的论文作过分析,发现其中有62篇篇(93%)可能是由于)可能是由于样本含量样本含量不足造成的假阴性。不足造成的假阴性。3.保证你的研究论文能通过统计学审查保证你的研究论文能通过统计学审查 据据国外国外6080年代对不同医学杂志发表论文的年代对不同医学杂志发表论文的调查,有调查,有统计错误统计错误的论文的百分比的论文的百分比最高达最高达72%,最,最低也有低也有20%。国内国内1984年对年对中华医学杂志中华医学杂志、中华内科杂中华内科杂志志、中华外科杂志中华外科杂志、中华妇产科杂志中华妇产科杂志、中华儿科
5、杂志中华儿科杂志595篇论文的调查结果,篇论文的调查结果,相对数相对数误误用为用为11.2%,抽样方法抽样方法误用误用15.9%,统计图表,统计图表误用误用11.7%。某研究者某研究者1996年对年对4586篇论文统计(中华医学会系篇论文统计(中华医学会系列杂志仅占列杂志仅占6.9%),数据分析方法误用达),数据分析方法误用达55.7%。4.获得循证医学证据的主要手段获得循证医学证据的主要手段“良好愿望的医学良好愿望的医学”(well-meaning medicine)转入)转入“以证据为基础的医学以证据为基础的医学”(evidence-based medicine,EBM)需要)需要有统计学
6、方法的支持。有统计学方法的支持。全世界的医学期刊每年大约刊登全世界的医学期刊每年大约刊登600600万学术万学术论文,但能作为可靠论文,但能作为可靠“证据证据”的论文并不多。的论文并不多。第二节第二节 医学统计工作内容及资料类型医学统计工作内容及资料类型一、原始统计数据的来源:一、原始统计数据的来源:1.常规保存数据常规保存数据医院信息系统(医院信息系统(HIS)、统计报表等)、统计报表等2.现场调查记录现场调查记录3.实验记录实验记录4.其他其他 一、研究设计一、研究设计二、搜集资料二、搜集资料三、整理资料三、整理资料四、分析资料四、分析资料五、结果表达五、结果表达二、统计工作的内容二、统计
7、工作的内容 设计的内容包括资料的收集、整理和分析设计的内容包括资料的收集、整理和分析全过程的设想和安排。常有:全过程的设想和安排。常有:1.调查设计(调查设计(survey design)对研究对象不施加任何干预,通常建立对研究对象不施加任何干预,通常建立随机抽随机抽样样(random sampling)方案。)方案。2.实验设计(实验设计(experiment design)对研究对象施加干预,如动物实验研究、临床对研究对象施加干预,如动物实验研究、临床试 验,通 常 建 立试 验,通 常 建 立 随 机 分 组随 机 分 组(r a n d o m allocation)方案。)方案。(一
8、)、研究设计(一)、研究设计实验设计的三个基本原则实验设计的三个基本原则1.随机化随机化(randomization)2.对照对照(control)3.重复重复(replication)(二)、收集资料(二)、收集资料 收集资料要遵循收集资料要遵循完整、准确、及时完整、准确、及时三个原则。三个原则。卫生工作中统计资料主要来源于三个方面:卫生工作中统计资料主要来源于三个方面:1.统计报表:由国家统一设计,要求医疗卫生机构统计报表:由国家统一设计,要求医疗卫生机构 定期逐级上报。定期逐级上报。如传染病防治法如传染病防治法。2.经常性工作记录:如经常性卫生监测记录等。经常性工作记录:如经常性卫生监测
9、记录等。3.专题调查和实验:专题调查和实验:我们常把前两个来源称我们常把前两个来源称经常性资料经常性资料,后者称为后者称为一时性资料。一时性资料。(三)、整理资料(三)、整理资料 目的是将搜集到的原始资料目的是将搜集到的原始资料系统化系统化、条条理化理化,便于进一步计算与分析。,便于进一步计算与分析。1.编码,将数据输入计算机编码,将数据输入计算机2.纠错改错、补漏等纠错改错、补漏等(四)、分析资料(四)、分析资料(data analysis)运用各种统计分析方法,结合专业知识,从经过运用各种统计分析方法,结合专业知识,从经过整理的资料中,计算出各种指标,进行整理的资料中,计算出各种指标,进行
10、统计描述统计描述和和统统计推断计推断,反映数据的综合特征,阐明事物的内在联系与规律。反映数据的综合特征,阐明事物的内在联系与规律。1.统计描述(统计描述(descriptive statistics):):指用统计指标、指用统计指标、统计表、统计图等方法对资料的数量特征及分布规律统计表、统计图等方法对资料的数量特征及分布规律进行测定和描述。进行测定和描述。2.统计推断(统计推断(inferential statistics):指如何抽样,指如何抽样,以及如何由样本信息推断总体特征问题。以及如何由样本信息推断总体特征问题。总体均数、总体率的可信区间及其假设检验总体均数、总体率的可信区间及其假设检
11、验 两个总体均数、总体率差值的可信区间及其假设检验两个总体均数、总体率差值的可信区间及其假设检验 多个总体指标之间的假设检验。多个总体指标之间的假设检验。(五)、结果表达(五)、结果表达 使用的统计学方法使用的统计学方法 使用的统计学软件(使用的统计学软件(SAS、SPSS)假设检验的统计量、假设检验的统计量、P值等值等 结论结论三、资料的类型三、资料的类型:只有认识了数据的特点,才只有认识了数据的特点,才 能正确地选用统能正确地选用统计分析方法计分析方法 基本概念:基本概念:变量变量及及变量值变量值 研究者对每个观察单位的研究者对每个观察单位的某项特征某项特征进行进行观察和测量,这种特征称为
12、观察和测量,这种特征称为变量变量,变量的测,变量的测得值叫得值叫变量值变量值(也叫观察值),全部变量(也叫观察值),全部变量值的集合也称为值的集合也称为资料资料。按按变量值的性质变量值的性质可将资料分为:可将资料分为:计量资料计量资料 计数资料计数资料 等级分组资料等级分组资料1.计量资料计量资料(定量资料、数值变量)(定量资料、数值变量)定义:定义:通过通过度量衡度量衡的方法,测量每一个观的方法,测量每一个观察单位的某项研究指标的量的大小,得到察单位的某项研究指标的量的大小,得到的一系列数据资料。例如:体重与身高的一系列数据资料。例如:体重与身高特点:表现为数值大小特点:表现为数值大小 有度
13、量衡有度量衡单位单位 多为多为连续性连续性资料资料 (通过测量得到通过测量得到)定义:定义:将全体观测单位按照将全体观测单位按照某种性质或特征某种性质或特征 分组,然后再分别清点各组观察单位分组,然后再分别清点各组观察单位 的个数。的个数。特点:没有特点:没有度量衡度量衡单位单位 多为多为间断性间断性资料资料 (通过枚举或记数得来)(通过枚举或记数得来)可分为可分为二项二项与与多项多项定性资料定性资料2.定性资料定性资料(分类资料、(分类资料、分类变量)分类变量)定义:定义:介于计量资料和计数资料之间的一种资介于计量资料和计数资料之间的一种资 料,通过料,通过半定量方法半定量方法测量得到。测量
14、得到。特点:特点:每一个观察单位没有确切值每一个观察单位没有确切值 各组之间有性质上的差别或程度上的不各组之间有性质上的差别或程度上的不 同。同。示例:示例:检查尿蛋白,观察单位是每一份尿标本,检查尿蛋白,观察单位是每一份尿标本,按结果等级不同可分为、按结果等级不同可分为、等。、等。3.等级分组资料等级分组资料(有序变量)(有序变量)1、定性数据、定性数据 (二项与多项)分类数据(二项与多项)分类数据 计数数据计数数据2、定量数据、定量数据 计量数据计量数据 区间数据区间数据 数值数据数值数据3、等级资料、等级资料 有序资料有序资料 定性与定量数据的别名定性与定量数据的别名三类数据间的关系三类
15、数据间的关系 例:一组例:一组20 40岁成年人的岁成年人的血压(血压(变量变量)以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压定量数据定量数据等级数据等级数据定性数据定性数据三类数据的编码与计算三类数据的编码与计算(1)(1)例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常(为界分为正常(0 0)与异常()与异常(1 1)两组,)两组,统计每组例数统计每组例数 单
16、纯随机抽样单纯随机抽样系统抽样系统抽样分层抽样分层抽样(2)增加样本量增加样本量n;(3)选择变异程度较小的研究指标。)选择变异程度较小的研究指标。减少抽样误差的方法减少抽样误差的方法:频率:样本的实际发生率频率:样本的实际发生率称为称为频率频率。设在相。设在相 同条件下,独立重复进行同条件下,独立重复进行n n次试验,次试验,事件事件A A出现出现m m次,则事件次,则事件A A出现的频率出现的频率 为为f=f=m m/n n。概率:随机事件发生的可能性大小概率:随机事件发生的可能性大小,用大写,用大写 的的P P 表示;取值表示;取值00,11。5 5、频率与概率、频率与概率 必然事件必然
17、事件 P P=1=1随机事件随机事件 0 0 P P 1 1不可能事件不可能事件 P P=0=0 统计学上把统计学上把P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为称为小概率事件小概率事件(习惯习惯),认为不大可能发生。,认为不大可能发生。通常我们把经常遇到的事件分为三种类型通常我们把经常遇到的事件分为三种类型:频率与概率间的关系:频率与概率间的关系:1.样本频率总是围绕概率上下波动;样本频率总是围绕概率上下波动;2.样本含量样本含量n越大,波动幅度越小,频越大,波动幅度越小,频 率越接近概率。率越接近概率。6、参数与统计量参数与统计量 (parameter
18、 and statistic)参数参数:总体总体的统计指标,的统计指标,如总体均数、总体标准差,如总体均数、总体标准差,分别用希腊字母记为分别用希腊字母记为、。固定的常数固定的常数 样本样本抽取部分观察单位抽取部分观察单位 推断推断inference统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为丁字母分别记为 。参数附近波动的随机变量参数附近波动的随机变量。SX、第二章第二章 集中趋势的统计描述集中趋势的统计描述主要内容主要内容2.1 频数分布频数分布2.2 平均数平均数 第一节第一节 频数分布频数分布 表表9-1 2002年某
19、市年某市150名正常成年男子的尿酸浓度(名正常成年男子的尿酸浓度(mol/L)142.3 148.8 142.7 144.4 144.7 145.1 143.3 154.2 152.3 142.7 156.6 137.9 143.9 141.2 139.3 145.8 142.2 137.9 141.2 150.6 142.7 151.3 142.4 141.5 141.9 147.9 125.9 139.9 148.9 154.9 145.7 140.8 139.6 148.8 147.8 146.7 132.7 149.7 154.0 158.2 138.2 149.8 151.1 140
20、.1 140.5 143.4 152.9 147.5 147.7 162.6 141.6 143.6 144.0 150.6 138.9 150.8 147.9 136.9 146.5 130.6 142.5 149.0 145.4 139.5 148.9 144.5 141.8 148.1 145.4 134.6 130.5 145.2 146.2 146.4 142.4 137.1 141.4 144.0 129.4 142.8 132.1 141.8 143.3 143.8 134.7 147.1 140.9 137.4 142.5 146.6 135.5 146.8 156.3 150
21、.0 147.3 142.9 141.4 134.7 138.5 146.6 134.5 135.1 141.9 142.1 138.1 134.9 146.7 138.5 139.6 139.2 148.8 150.3 140.7 143.5 140.2 143.6 138.7 138.9 143.5 139.9 134.4 133.1 145.9 139.2 137.4 142.3 160.9 137.7 142.9 126.8 频数分布及其制作频数分布及其制作 对某个随机事件进行重复观察,其对某个随机事件进行重复观察,其中某变量值出现的次数被称作中某变量值出现的次数被称作频数频数。当汇总
展开阅读全文