[理学]生物统计-第二章-资料整理2课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《[理学]生物统计-第二章-资料整理2课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 理学 生物 统计 第二 资料 整理 课件
- 资源描述:
-
1、上次课主要内容回顾上次课主要内容回顾1. 原始资料原始资料 2. 统计资料统计资料3. 资料整理的目的和过程资料整理的目的和过程4. 连续性资料和离散性资料连续性资料和离散性资料5. 连续性资料的频率分布(全距、组数、组距、连续性资料的频率分布(全距、组数、组距、组中值、组上限、组下限、频数、频率)组中值、组上限、组下限、频数、频率)6. 离散性资料的频率分布(类别、频数、频率)离散性资料的频率分布(类别、频数、频率)7. 统计表(简单表、复合表、与统计图的关系)统计表(简单表、复合表、与统计图的关系)8. 统计图(种类以及适合那类资料)统计图(种类以及适合那类资料) 在数理统计中,平均数是用
2、来反映在数理统计中,平均数是用来反映一组变数的集中趋势,即变数分布的中一组变数的集中趋势,即变数分布的中心位置。常用的度量指标有:心位置。常用的度量指标有: 1. 1. 算术平均数算术平均数 2. 2. 中位数(中位数(Md) 3. 3. 众数(众数(Mo) 4. 4. 几何平均数(几何平均数(G G) 5. 5. 调和平均数(调和平均数(H) X2.6 集中趋势的度量集中趋势的度量意义:意义: 作为一个资料的代表,指资料中各变数集中作为一个资料的代表,指资料中各变数集中较多的中心位置,用来与另一资料相比较。不同的较多的中心位置,用来与另一资料相比较。不同的平均数适合于不同的数据资料。平均数适
3、合于不同的数据资料。例如:例如:不同国家、地区、种族之间身高、体重等不同国家、地区、种族之间身高、体重等的的 比较;不同品种的家畜、家禽之间生产性能比较;不同品种的家畜、家禽之间生产性能 的比较的比较2.6 集中趋势的度量集中趋势的度量主要内容:主要内容:一、算术平均数一、算术平均数二、中位数、众数、几何平均数和调和平均数二、中位数、众数、几何平均数和调和平均数三、三、5 5 种平均数的关系和评价种平均数的关系和评价 2.6 集中趋势的度量集中趋势的度量2.6.1 2.6.1 算术平均数算术平均数一、定义一、定义 一组资料中,所有观测值的总和除以其个资料中,所有观测值的总和除以其个数所得到的商
4、,称为算术平均数,简称平均数数所得到的商,称为算术平均数,简称平均数或均数。或均数。最常用的一种集中趋势度量指标。最常用的一种集中趋势度量指标。 样本的平均数记为样本的平均数记为 总体平均数记为总体平均数记为 x2.6.1 2.6.1 算术平均数算术平均数xnnnxxixxx 211 :第:第i个观察值或变数个观察值或变数 n:观察值或变数的个数:观察值或变数的个数 :求和符号(:求和符号(sigma)xi计算公式:计算公式:一、直接法:一、直接法: 例例2.12.1:5 5头猪的体重分别为头猪的体重分别为7070、7272、8080、8383、 88kg88kg,问,问 5 5头猪的算术平均
5、数是多少?头猪的算术平均数是多少?)(6 .78888380727051kgx 从计算结果看从计算结果看5 5头猪都距头猪都距78.678.6(kgkg)不远,)不远,所以平均数是数量资料的代表值。所以平均数是数量资料的代表值。 上述计算方法称为上述计算方法称为直接法直接法,适用于样本小,适用于样本小,即资料内包含变数个数不多,一般在即资料内包含变数个数不多,一般在3030个变数以个变数以下未经分组的资料。下未经分组的资料。2.6.1 2.6.1 算术平均数算术平均数二、加权法二、加权法 1. 1. 分类资料:每个类别在某个指标上取相同的值。分类资料:每个类别在某个指标上取相同的值。 2. 2
6、. 计数资料和连续性资料:频率分布表计数资料和连续性资料:频率分布表 加权法,即计算时先将各个变数乘上它加权法,即计算时先将各个变数乘上它的权数,再经过总和,然后除以权数的总合,的权数,再经过总和,然后除以权数的总合,称为加权平均数。称为加权平均数。2.6.1 2.6.1 算术平均数算术平均数fxfiiix x xi i= =变数值变数值 f fi i= =变数值变数值x xi i出现的频数出现的频数计算公式:计算公式:2.6.1 2.6.1 算术平均数算术平均数例例2.22.2:一个有一个有10001000个个体的群体,等位基因个个体的群体,等位基因 A A 的的 频率为频率为0.60.6,
7、另一个,另一个400400个个体的群体,个个体的群体, 等位基因等位基因 A A 的频率为的频率为0.30.3,这两个群体的混,这两个群体的混 合在一起,整个混合群体的等位基因合在一起,整个混合群体的等位基因 A A 的的 频率为:频率为:5131. 040010004003 . 010006 . 02.6.1 2.6.1 算术平均数算术平均数例例2.32.3:200200头大白猪的仔猪的一月窝重的资料见表头大白猪的仔猪的一月窝重的资料见表2-12-1组别组别组中值组中值频数(频数(f f)fxfx8-8-16-16-24-24-32-32-40-40-48-48-56-56-64-64-72
8、-72-80-80-88-88-96-96-104-104-112-112-121220202828363644445252606068687676848492921001001081081161164 46 69 9101013131717262635352828212116168 84 43 348481201202522523603605725728848841560156023802380212821281764176414721472800800432432348348总合总合20020013120131202.6.1 2.6.1 算术平均数算术平均数)(6.65200131203.
9、643116.620412kgx2.6.1 2.6.1 算术平均数算术平均数fxfiiixx xi i= =组中值组中值f fi i= =组中值出现的频数组中值出现的频数例例2.3:表:表22和表和表25三、性质三、性质(一)离均差之和为零:(一)离均差之和为零: 一个样本观察值与平均数之差简称离一个样本观察值与平均数之差简称离均差。均差。(xi- )=(x1- )+(x2- )+(xn- )= x1+x2+xn-n= xi- n xi/n= 0 xxxxx2.6.1 2.6.1 算术平均数算术平均数例例2.22.2:5头猪的体重分别为头猪的体重分别为70、72、80、83、 88kg,5头猪
10、的算术平均数是头猪的算术平均数是78.6 kg。 (70-78.670-78.6)+ +(72-78.672-78.6)+ +(80-78.680-78.6)+ + (83-78.683-78.6)+ +(88-78.688-78.6) = =(-8.6-8.6)()(- 6.6- 6.6)+ 1.4+ 4.4+ 9.4+ 1.4+ 4.4+ 9.4 = 0 = 02.6.1 2.6.1 算术平均数算术平均数(二)离均差平方和最小:(二)离均差平方和最小:一个样本的各个观察值一个样本的各个观察值与平均数之差的平方和比各个观察值与任意其他数与平均数之差的平方和比各个观察值与任意其他数之差的平方和
11、小。即:之差的平方和小。即:Axxxii22所以:平均数是与各个观察值最接近的数值。所以:平均数是与各个观察值最接近的数值。所以:平均数代表这个样本的集中趋势。所以:平均数代表这个样本的集中趋势。2.6.1 2.6.1 算术平均数算术平均数定义:定义:n n个非负数的乘积开个非负数的乘积开n n次方的根称为几何平均次方的根称为几何平均 数,用数,用 G G 表示。表示。ninnXXXXG 21为了计算方便,各变数先取对数,再相加除以为了计算方便,各变数先取对数,再相加除以n n,即,即为为logGlogG,再求其反对数,即为,再求其反对数,即为G G值。值。nnXXXGGlglglglg)(l
12、glg21111 2.6.2 2.6.2 几何平均数几何平均数2.6.2 2.6.2 几何平均数几何平均数从公式可以知道:几何平均数就是首先将原数据转从公式可以知道:几何平均数就是首先将原数据转换为对数;然后求对数值的算数平均数;最后再取换为对数;然后求对数值的算数平均数;最后再取反对数还原。反对数还原。几何平均数用于以百分率、比例表示的数据资料,几何平均数用于以百分率、比例表示的数据资料,如增长率、利率、药物效价、抗体滴度等。如增长率、利率、药物效价、抗体滴度等。能够消弱数据中个别过分偏大值的影响。能够消弱数据中个别过分偏大值的影响。2.6.2 2.6.2 几何平均数几何平均数例例2.3:某
13、奶牛场在某奶牛场在1995年有年有100头奶牛,已知在头奶牛,已知在1996,1997和和1998年的奶牛头数分别为前一年的年的奶牛头数分别为前一年的2,3和和4.5倍,求其年平均增加率。倍,求其年平均增加率。 解:解:3275 . 43233G1998年的奶牛头数为:年的奶牛头数为: 100234.52700头头 或者或者100332700头头2.6.2 2.6.2 几何平均数几何平均数【例】【例】 某波尔山羊群某波尔山羊群19972000年各年度的存年各年度的存栏数见表,试求其年平均增长率。栏数见表,试求其年平均增长率。 2.6.2 2.6.2 几何平均数几何平均数)lglg(lg1lg2
14、11nxxxn2.6.2 2.6.2 几何平均数几何平均数加权法:分类资料或计数和连续性资料加权法:分类资料或计数和连续性资料总观测值个数个体的取值(组中值)组类第类(组)中的频数第类别数:.)(:3212121fffniXifkXXXGiinfkffk iiXfnGlg1lg1对数形式对数形式例例2.4P19定义:各观察值倒数的平均数的倒数定义:各观察值倒数的平均数的倒数 inXnxxxnH11111121适用于极端右偏态,例适用于极端右偏态,例33页页2.6.3 2.6.3 调和平均数调和平均数iiiXffH1简单调和简单调和平均数平均数加权调和加权调和平均数平均数从公式可以知道:调和几何
15、平均数就是首先将原数从公式可以知道:调和几何平均数就是首先将原数据转换为倒数;然后求倒数值的算数平均数;最后据转换为倒数;然后求倒数值的算数平均数;最后再取倒数还原。再取倒数还原。调和平均数主要用于速度类资料,或者数据中有个调和平均数主要用于速度类资料,或者数据中有个别极端大的值的情况。别极端大的值的情况。2.6.3 2.6.3 调和平均数调和平均数2.6.3 2.6.3 调和平均数调和平均数例例2.42.4:用某药物救治:用某药物救治1212只中毒的小鼠,它们的存活只中毒的小鼠,它们的存活天数记录如下:天数记录如下:8 8,8 8,8 8,1010,1010,7 7,1313,1010,9
16、9,1414,另外有两只未死亡,求平均存活天数。,另外有两只未死亡,求平均存活天数。解:未死亡的存活天数记为解:未死亡的存活天数记为,为极端右偏态,用,为极端右偏态,用算术平均数不合理。算术平均数不合理。14.11.12118181H定义:将定义:将n n个观察值从小到大依次排队,位于中个观察值从小到大依次排队,位于中间的那个观察值称为中位数。间的那个观察值称为中位数。 2.6.4 2.6.4 中位数(中位数(M Md d):观察值个数为偶数时,当为奇数时,当nXXMnXMnnndnd212221 适用于适用于偏态分布偏态分布的资料。的资料。例:例:2.5 现有一窝仔猪的出生重资料为:现有一窝
17、仔猪的出生重资料为:1.4,1.0,1.3,1.2,1.6kg,试求其中位数。,试求其中位数。解:首先将数据资料排序:解:首先将数据资料排序:1.0,1.2,1.3,1.4, 1.6;然后计算中位数:;然后计算中位数: (n+1)/2=(5+1)/2=3;Md=X3=1.3 如果增加一头仔猪,出生重为如果增加一头仔猪,出生重为1.8kg,计算中位数:,计算中位数: n/2=6/2=3 (n/2)+1=3+1=4; Md=(X3+X4)/2=(1.3+1.4)/2=1.352.6.4 2.6.4 中位数(中位数(M Md d)2.6.4 2.6.4 中位数(中位数(M Md d) 对于频数分布的
18、资料,公式如下:对于频数分布的资料,公式如下:)2(CnfiLMmmdd Lmd:中位数所在组的组下限;:中位数所在组的组下限; fm:中位数所在组的频数;:中位数所在组的频数; C:从第一组到中位数所在组的前:从第一组到中位数所在组的前一组的累积频数。一组的累积频数。 n:样本含量;:样本含量; i:组距;:组距; 例:表例:表262.6.4 2.6.4 中位数(中位数(M Md d)97.12)66100(35112)2(CnfiLMmmdd定义:在资料中某一个变数出现次数最多,就称定义:在资料中某一个变数出现次数最多,就称 之为众数。之为众数。1.1. 离散性资料:出现频数最多的数。离散
19、性资料:出现频数最多的数。2. 2. 连续性资料:频数分布表中,频数出现最多的连续性资料:频数分布表中,频数出现最多的 一组的组中值。一组的组中值。 !有的资料可出现多个众数,即多个数具有有的资料可出现多个众数,即多个数具有相同的最高频数;相同的最高频数;有的资料没有众数,即所有数出有的资料没有众数,即所有数出现的频数都相同。现的频数都相同。2.6.5 2.6.5 众数(众数(mode ,Mmode ,M0 0)2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价一、各个集中趋势度量指标之间的关系一、各个集中趋势度量指标之间的关系 1.1.在完全对称
20、分布情况下,算数平均数、中位数在完全对称分布情况下,算数平均数、中位数 和众数三者相等。和众数三者相等。2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价二、集中趋势指标的评价二、集中趋势指标的评价 应满足以下几个条件:应满足以下几个条件: 1.1.必须有严格的定义及算法,避免有主观成分存必须有严格的定义及算法,避免有主观成分存在其间;在其间; 2.2.计算过程中应利用全部观察值;计算过程中应利用全部观察值; 3.3.简单明了,容易领悟,容易计算;简单明了,容易领悟,容易计算; 4.4.受抽样变动影响不大,即抽样误差小。受抽样变动影响不大,即抽样误
21、差小。 5.5.适用于代数方法处理。适用于代数方法处理。 (1 1)算术平均数)算术平均数 能够满足以上所有的条件,适用于正态分布资能够满足以上所有的条件,适用于正态分布资料。料。 家畜的大多数数量性状都是正态分布,因此算家畜的大多数数量性状都是正态分布,因此算术平均数是最常用的,也是最重要的。术平均数是最常用的,也是最重要的。 但是当分布不对称时,呈偏态时,用算术平均但是当分布不对称时,呈偏态时,用算术平均数则难以表示资料的集中趋势。数则难以表示资料的集中趋势。2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价2.6.6 2.6.6 各个集中趋势
22、度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价(2 2)中位数)中位数 能够满足第能够满足第 2 2、3 3条,适用于非参数检验,如条,适用于非参数检验,如卡方检验。卡方检验。(3 3)几何平均数和调和平均数)几何平均数和调和平均数 能够满足第能够满足第 1 1、2 2 、5 5条,适用于右偏态分布。条,适用于右偏态分布。(4 4)众数)众数 仅满足第仅满足第3 3条,日常生活常用,如鞋子、衣服尺条,日常生活常用,如鞋子、衣服尺码码 2.6.6 2.6.6 各个集中趋势度量指标之间的关系和评价各个集中趋势度量指标之间的关系和评价x2.6.6 2.6.6 各个集中趋势度量指标之间的
23、关系和评价各个集中趋势度量指标之间的关系和评价例:一家小企业例:一家小企业13个员工工资为:个员工工资为:13500,11500,11000,9000,8500,8000,6500,6000,3500,3500,3500,3500,3000元。元。如果低工资的员工抱怨工资低,老板可以用算术平均如果低工资的员工抱怨工资低,老板可以用算术平均数消除员工不满,我们平均有数消除员工不满,我们平均有7000元收入。元收入。如果慈善机构来募捐,他会搪塞说,我们多数人工资如果慈善机构来募捐,他会搪塞说,我们多数人工资才才3500元(众数)。元(众数)。在别的场合,他又可以用中位数在别的场合,他又可以用中位数
24、6500元。元。对于学过统计的人来说,不能盲目接受别人说的一个对于学过统计的人来说,不能盲目接受别人说的一个统计指标,而应对数据进行分析并作出科学的评价。统计指标,而应对数据进行分析并作出科学的评价。一、平均数的代表程度与样本的变异程度有关一、平均数的代表程度与样本的变异程度有关 一个样本内有很多的变数,用平均数作为样本一个样本内有很多的变数,用平均数作为样本的代表,其代表程度决定于样本内各个变数的变异的代表,其代表程度决定于样本内各个变数的变异程度。程度。1.1.如果各个变数相同或者变异程度比较小,则平均如果各个变数相同或者变异程度比较小,则平均数能够代表整个样本。数能够代表整个样本。2.2
展开阅读全文