医学精品课件:第十五章数值变量的统计描述(2013临本).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《医学精品课件:第十五章数值变量的统计描述(2013临本).ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 精品 课件 第十五 数值 变量 统计 描述 2013
- 资源描述:
-
1、第十五章第十五章 数值变量的统计分析数值变量的统计分析一、数值变量的频数分布表与频数分布图一、数值变量的频数分布表与频数分布图 在医学研究工作中,所收集到的原始数在医学研究工作中,所收集到的原始数据一般是无规律所循的,特别当观察值较多据一般是无规律所循的,特别当观察值较多时,直接从原始数据很难得出概括的印象。时,直接从原始数据很难得出概括的印象。必须通过资料清理,编制频数表,来显示数必须通过资料清理,编制频数表,来显示数据分布的范围、数据最集中的区间和频数分据分布的范围、数据最集中的区间和频数分布的形态等。布的形态等。第一节第一节 集中趋势和离散趋势的统计描述集中趋势和离散趋势的统计描述 例例
2、 15.1一般可分为一般可分为计量资料计量资料、计数资料计数资料和和等级资料等级资料。对医学资料的对医学资料的统计描述统计描述是统计分析的一个方是统计分析的一个方面,也是科研结果表述的基本内容。描述的面,也是科研结果表述的基本内容。描述的方法包括方法包括计算相关的指标计算相关的指标、用、用统计表统计表和和统计统计图图来表示。来表示。统计分析统计分析统计描述统计描述统计推断统计推断(第十六章第十六章)统计描述统计描述统计推断统计推断统计分析的两大方面统计分析的两大方面统计描述统计描述用适当的统计图(表)和统计指用适当的统计图(表)和统计指标(如均数、标准差、有效率、治愈率等)标(如均数、标准差、
3、有效率、治愈率等)来描述资料的分布规律(图表)和数量特征来描述资料的分布规律(图表)和数量特征(统计指标)。(统计指标)。用直观的、简单的形式来表达用直观的、简单的形式来表达测定了测定了110例正常人血铅含量(例正常人血铅含量(g/L),见下表。),见下表。血铅含量血铅含量0-4-8-12-16-20-24-28-合计合计频频 数数1423 301914613110广西人均卫生事业费在全国位次广西人均卫生事业费在全国位次(1998(1998年年)指指 标标 广广西西(元元)全全国国(元元)广广西西在在全全国国位位次次 人人均均卫卫生生事事业业费费 11.24 18.52 28 人人均均医医院院
4、经经费费 3.70 7.61 30 人人均均卫卫生生院院补补助助 2.67 3.60 28 人人均均防防治治防防疫疫事事业业费费 1.66 2.62 29 人人均均妇妇幼幼保保健健经经费费 0.84 0.76 16 1999年中国农村死亡原因构成年中国农村死亡原因构成(%)计量资料是连续性的资料,我们可把该计量资料是连续性的资料,我们可把该组数据范围大小分成若干段,然后再统计各段组数据范围大小分成若干段,然后再统计各段的频数,并用表格来表示的频数,并用表格来表示,即称为计量资料的即称为计量资料的频数分布表。频数分布表。(一)频数分布表的编制(一)频数分布表的编制 最小值最小值最大值最大值个数个
5、数:2 8 15 25 16 7 4 2计量资料的频数表:计量资料的频数表:即按数量大小分组,然后再清点即按数量大小分组,然后再清点各组(段)的个数各组(段)的个数(一)频数分布表的编制(一)频数分布表的编制(1)求全距)求全距 最大值最小值最大值最小值 104.8-80.124.7 150名名3岁女孩身高值岁女孩身高值(cm)。编制步骤:编制步骤:计量资料的频数表:计量资料的频数表:即按数量大小分组,然后再清点即按数量大小分组,然后再清点各组(段)的个数各组(段)的个数R最小值最小值最大值最大值(2)划分组段)划分组段:i极差极差/组数组数24.7/102.47 2.5 原则:原则:n50,
6、9-15组。实组。实际应用时,应根据研究目的和分析要求,灵活确定际应用时,应根据研究目的和分析要求,灵活确定组数。一般以能反映频数分布的特征为原则。组数。一般以能反映频数分布的特征为原则。原则:第一组段包括最小值,最后组段包括最大值。原则:第一组段包括最小值,最后组段包括最大值。每一组段都有上限和下限每一组段都有上限和下限下限下限:组段的起点(最小值):组段的起点(最小值)上限上限:组段的终点(最大值):组段的终点(最大值)80.1104.8组距组距组距极差极差/组数(拟采用等距分组)组数(拟采用等距分组)24.7确定组数:确定组数:拟分几个组?(一般拟分几个组?(一般10组)组)求全距:求全
7、距:线段的长度线段的长度定组段:定组段:划范围划范围统计各组段的人数:统计各组段的人数:下限下限上限(下组段的下限)上限(下组段的下限)编制步骤:编制步骤:读取数据,然后读取数据,然后“对号入座对号入座”划记划记80.1100.1 频数表的用途频数表的用途:1描述频数分布的类型和特征描述频数分布的类型和特征 Descriptive Statistics频数分布表(频数分布表(frequency table)2便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值3便于进一步做统计分析和处理便于进一步做统计分析和处理(二)频数分布的特征(二)频数分布的特征1、集中趋势集中趋势(centra
8、l tendency):数据向某一:数据向某一数值集中的倾向数值集中的倾向(中等身高(中等身高92-94cm的人数的人数最多)最多)2、离散趋势离散趋势(tendency of dispersion):数据:数据的数值大小不等的倾向的数值大小不等的倾向(由中间向两侧逐渐(由中间向两侧逐渐减少)减少)集中趋势集中趋势离散趋势离散趋势离散趋势离散趋势(三)频数分布的类型(三)频数分布的类型 正态、对称分布正态、对称分布 偏态分布偏态分布 正偏态负偏态频数分布图频数分布图以观察变量(组段)为横轴,频数或频率为纵轴绘制统计图。可直观地反映频数分布的特征。对称分布示意图对称分布示意图正态分布示意图正态分
9、布示意图可以是多峰,可以是多峰,只要左右对称只要左右对称只能是单峰只能是单峰二二 集中趋势的描述集中趋势的描述 描述计量资料分布特征的指标描述计量资料分布特征的指标集中趋势指标集中趋势指标离散趋势指标离散趋势指标平均数平均数(average)R、Q、S、CV常用平均数的种类:常用平均数的种类:1、算术均数算术均数(arithmetic mean)(简称(简称均数均数,mean)2、几何均数几何均数(geometric mean)3、中位数中位数(median)(一)算术均数(均数)(一)算术均数(均数)样本均数用样本均数用X表示,总体均数用表示,总体均数用表示表示.1、适用范围、适用范围 对称
10、分布,尤其是正态分布的资料对称分布,尤其是正态分布的资料 2、计算方法:、计算方法:(1)直接法)直接法 nxx例例 有有10人身高值:人身高值:92.5,82.5,95.1 求平均求平均身高。身高。)(27.93101.95.5.825.92cmnxx(2)加权法)加权法ffxxf为相同观察值的个数为相同观察值的个数(频数频数)例:例:2,3,3,4,4,4,5,5,5,6 求均数。求均数。方法一:方法一:1.41041106555444332nxx方法二:方法二:1.41041101625342312ffxx直接法直接法加权法加权法加权法用于频数表资料加权法用于频数表资料 其中:其中:X组
11、中值(上限下限)组中值(上限下限)/2 f频数频数 ffxx为什么用组中值?为什么用组中值?问题:所有的频数表资料计算均数都需要用组中值计算吗?3、均数的应用、均数的应用 反映一组观察值的平均水平反映一组观察值的平均水平描述正态分布特征的重要参数描述正态分布特征的重要参数原始数据的分布为偏态分布,但经原始数据的分布为偏态分布,但经对数变换后的分布呈正态分布对数变换后的分布呈正态分布(二)几何均数(二)几何均数(geometric mean,简记为简记为G)1、适用资料:、适用资料:对数正态分布资料对数正态分布资料 (血清抗体滴度资料)(血清抗体滴度资料)(微量元素资料)(微量元素资料)xlgx
展开阅读全文