生物统计学-统计数据的收集与整理.课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计学-统计数据的收集与整理.课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 统计数据 收集 整理 课件
- 资源描述:
-
1、生物统计学生物统计学 Biostatistics 第一章第一章 统计数据的收集统计数据的收集与整理与整理2012.2总体(总体(pupulation):根据研究目的确定的:根据研究目的确定的同质同质研究对象的研究对象的全体全体(集合)。分(集合)。分有限总体有限总体与与无限总体无限总体。个体(个体(individual)样本(样本(sample):):从总体中随机抽取的若干从总体中随机抽取的若干个个体所构成的集合。个个体所构成的集合。样本单位(样本单位(sample unit)样本含量(样本含量(sample size),记为),记为n。v从总体中获得样本的过程称为从总体中获得样本的过程称为抽
2、样抽样(sampling)v抽样的目的,是希望通过对样本的研究,抽样的目的,是希望通过对样本的研究,推断其总体,样本必须能够代表总体。我推断其总体,样本必须能够代表总体。我们需要的样本应该是一个总体的缩影。为们需要的样本应该是一个总体的缩影。为了达到这个目的,就需要用了达到这个目的,就需要用随机抽样随机抽样(random sampling)的方法获得样本。的方法获得样本。随机数字表的使用随机数字表的使用见附表一(见附表一(p251)v 从一有限总体中抽样,可分为从一有限总体中抽样,可分为放回式抽样放回式抽样(sampling with replacement)和和非放回式抽非放回式抽样(样(s
3、ampling without replacement)。所谓。所谓放回式抽样是指:从总体中抽出一个个体,放回式抽样是指:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次记下它的特征后,放回总体中,再做第二次抽样。这种抽样方式可能会重复抽中某一个抽样。这种抽样方式可能会重复抽中某一个体。非放回式抽样是指:从总体中抽出个体体。非放回式抽样是指:从总体中抽出个体后,不再放回。后,不再放回。不同的抽样方不同的抽样方式得到不同的式得到不同的数据分布数据分布1.2 数据类型及频数(率)分布数据类型及频数(率)分布v 与某种标准作比较所得到的数据称为连续型连续型数据数据(continuous
4、data),又称为度量数据(measurement data)。v由记录不同类别个体的数目所得到的数据,称为离散型数据离散型数据(discrete data),),又称为计数数据(count data)。定量变量(定量变量(quantitative variable):):亦称为数值变亦称为数值变量,变量值是定量的,表现为数值大小,一般有度量,变量值是定量的,表现为数值大小,一般有度量衡单位。量衡单位。e.g. 身高、体重。身高、体重。定性变量(定性变量(qualitative variable):):亦称为分类变量,亦称为分类变量,其变量值是定性的,表现某个体属于几种互不相容其变量值是定性的
5、,表现某个体属于几种互不相容的类型中的一种。的类型中的一种。e.g. 血型,豌豆花的颜色。血型,豌豆花的颜色。常数(常数(constant):):是不能给予不同数值的变量,代是不能给予不同数值的变量,代表事物特征和性质的数值。表事物特征和性质的数值。e.g.样本平均数,标准差。样本平均数,标准差。 根据观察数据之间有无缝隙(根据观察数据之间有无缝隙(gap),常将数据),常将数据分类为分类为离散型(离散型(discrete)变量(有缝隙)变量(有缝隙)与与连续型连续型(continuous)变量(无缝隙)变量(无缝隙)两大类。两大类。 v在判断数据的类型之后,就要进一在判断数据的类型之后,就要
6、进一步研究数据的变化规律。描述数据步研究数据的变化规律。描述数据变化规律的最简单方法是将这些数变化规律的最简单方法是将这些数据列成据列成频数表(频数表(frequency table)或或绘成绘成频数图(频数图(frequency graph),根据频数分布进行研究。根据频数分布进行研究。频数(率)表和频数(率)图的编绘频数(率)表和频数(率)图的编绘离散型数据离散型数据频数(率)表频数(率)表和频数(率)图和频数(率)图 编制连续型数据的频数(率)表编制连续型数据的频数(率)表的方法步骤的方法步骤v从原始数据表中从原始数据表中找出最大值和最小值,并求出找出最大值和最小值,并求出极差极差。v决
7、定划分的组数决定划分的组数,分组数是由数据的多少决定,分组数是由数据的多少决定的,在数据较少时,如的,在数据较少时,如50100个数,可以分个数,可以分为为710组。数据较多时,可分为组。数据较多时,可分为1520组。组。v根据极差与决定划分的组数,根据极差与决定划分的组数,确定组限确定组限。v在频数表中在频数表中列出全部列出全部组限组限、组界组界及及中值中值。v将原始数据表中数据,用唱票的方式填入频数将原始数据表中数据,用唱票的方式填入频数表中,表中,计算出各组的频数和频率计算出各组的频数和频率。连续型数据连续型数据频数(率)表频数(率)表和频数(率)图和频数(率)图最低与最高一组非零最低与
8、最高一组非零频数的点分别与相邻频数的点分别与相邻零频数中值点相连零频数中值点相连累计频数图的意义?累计频数图的意义?横坐标与多边形横坐标与多边形图有何差异?图有何差异?累计的意义?累计频数图的意义?累计的意义?累计频数图的意义?研究频数(率)分布的意义研究频数(率)分布的意义1. 根据频数(率)分布,可以根据频数(率)分布,可以看出数据的集中看出数据的集中情况(重心)情况(重心)。v平均值(平均值(average value, mean)v算术平均数(算术平均数(arithmetic mean)、中位数)、中位数(median)和众数()和众数(mode)。)。2. 从频数(率)表或频数(率)
9、图中,可以直从频数(率)表或频数(率)图中,可以直观地看出观地看出数据的变异情况数据的变异情况。3. 可以直观可以直观看出频数(率)图的变化形状看出频数(率)图的变化形状。还。还可显示一些不规则的情况。可显示一些不规则的情况。频数(率)分布的不恒定性频数(率)分布的不恒定性v当用随机抽样方法获得样本时,由于偶然性,当用随机抽样方法获得样本时,由于偶然性,有时在一个样本中抽到的数值偏高,而另一个有时在一个样本中抽到的数值偏高,而另一个样本中数值偏低,使两个样本的频数分布出现样本中数值偏低,使两个样本的频数分布出现不同。由于样本分布的不恒定性,当用样本去不同。由于样本分布的不恒定性,当用样本去推断
10、总体时,推断的结果也会有所不同。这就推断总体时,推断的结果也会有所不同。这就需要考察当用某一样本去推断总体时所得结果需要考察当用某一样本去推断总体时所得结果与真正总体之间有多大与真正总体之间有多大,结果的可信度有,结果的可信度有多高。多高。1.3 样本样本的几个特征数的几个特征数样本统计量样本统计量平均数(平均数(mean)生物统计学中,使用最多的是算术平均数(生物统计学中,使用最多的是算术平均数( )。)。x求和符号求和符号3个简单运算法则个简单运算法则b-(a-1)c算数平均数的基本特征算数平均数的基本特征v算术平均数的计算与样本内的每个值都有关算术平均数的计算与样本内的每个值都有关,它的
11、大小受每个值的影响。它的大小受每个值的影响。v若每个若每个xi都都乘乘以相同的数以相同的数k,则平均数亦应,则平均数亦应乘乘以以k。v若每个若每个xi都都加加上相同的数上相同的数A,则平均数亦应,则平均数亦应加加上上A。v如果如果 是是n1个数的平均数,个数的平均数, 是是n2个数的平均个数的平均数,那么全部数,那么全部n1 n2个数的算术平均数是个数的算术平均数是加加权平均数(权平均数(weighted mean):平均数的计算方法平均数的计算方法v离散型数据频数资料:离散型数据频数资料:注意记住所注意记住所有字母符号有字母符号的含义的含义例例1.1 新生儿体重新生儿体重作表计算是个好习惯作
展开阅读全文