01-2 统计资料的整理与描述.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《01-2 统计资料的整理与描述.ppt》由用户(金钥匙文档)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 01_2 统计资料的整理与描述 01 _2 统计资料 整理 描述
- 资源描述:
-
1、柏建岭 南京医科大学公共卫生学院生物统计学系,Medical statistics 医学统计学,统计资料的整理与描述 数值变量资料,2020/4/7,柏建岭讲稿,2,主要内容,个体变异 频数分布表(图) 定量指标的描述 集中位置 离散趋势 总结,2020/4/7,柏建岭讲稿,3,个体变异(individual variation),是同质观察对象间表现出的差异。 变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。 就个体而言:变异是随机的(random)。 就总体而言:个体变异是有规律的。,2020/4/7,柏建岭讲稿,4,原始数据,100名成年男性血红细胞计数(1012
2、/L )资料如下:,频数分布表和频数分布图,原因:由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。 解决:频数分布表的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组的频数,得到频数分布表;在将频数表绘制成频数分布图。,2020/4/7,柏建岭讲稿,6,频数表编制步骤,求极差 选定适当的组段数后估计组距 列出组段 划记归组获得频数 求频率,完成频数表,2020/4/7,柏建岭讲稿,7,频数分布表的编制,求极差或全距(Range): R=Xmax-Xmin R = 6.18-3.29
3、=2.89 选定适当的组段数后估计组距( i ) 组段数的选取以能反映资料的分布特征为宜 一般取8 15组 i =2.89/10=0.2890.3,2020/4/7,柏建岭讲稿,8,频数分布表的编制,列出组段 组段的含义:包括组段的下限而不含组段的上限 。如:3.20 等价于 3.20,3.50) 第一个组段应包含最小值 最后一个组段应包含最大值,2020/4/7,柏建岭讲稿,9,频数分布表的编制,划记归组获得频数 常用的划记方法: “正” ;“|” 求频率,完成频数表 相应的频数除以总数即为频率 各组段的频率总和为1或者100%,100名成年男性血红细胞计数频数表,11,100名成年男子红细
4、胞计数频数图,图2.1 100名成年男性的血红细胞计数的频数分布,2020/4/7,柏建岭讲稿,12,频数分布表和频数分布图的用途,描述分布类型 描述分布的特征 便于发现特大、特小的可疑值 便于计算有关指标、统计分析与处理,2020/4/7,柏建岭讲稿,13,频数分布类型,对称分布:以正态分布较为常见 非对称分布:偏态分布 正偏态:右侧左侧 向右侧拖尾 负偏态:左侧右侧 向左侧拖尾,2020/4/7,柏建岭讲稿,14,频数分布特征,数据分布的范围: 3.296.18 集中位置:中等大小人数居多,向中间集中 数据最集中的区间:4.705.00 离散趋势:以中等大小的区间为中心,向两侧逐渐减少 分
5、布形态:基本对称,2020/4/7,柏建岭讲稿,15,2020/4/7,柏建岭讲稿,16,2020/4/7,柏建岭讲稿,17,2020/4/7,柏建岭讲稿,18,2020/4/7,柏建岭讲稿,19,数值变量资料的统计指标,集中位置的描述 离散趋势的描述,2020/4/7,柏建岭讲稿,20,集中位置的描述-平均数(average),均数(arithmetic mean, mean),总体均数,样本均数,2020/4/7,柏建岭讲稿,21,平均数(average),加权均数(weighted mean) 均数是加权均数的一个特例,2020/4/7,柏建岭讲稿,22,平均数(average),几何均
6、数(geometric mean),2020/4/7,柏建岭讲稿,23,几何均数例,1:10, 1:20, 1:40, 1:80, 1:160,2020/4/7,柏建岭讲稿,24,平均数(average),中位数(median) 将一组数据按从小到大的顺序排列,位置居中的数即是中位数。,2020/4/7,柏建岭讲稿,25,中位数例,9例正常人的发汞值(mol/kg ): 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 10例正常人的发汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=
展开阅读全文