生物统计课件第二章-的整理与特征数的计算.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物统计课件第二章-的整理与特征数的计算.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计 课件 第二 整理 特征 计算
- 资源描述:
-
1、第二章第二章 数据的整理与分析数据的整理与分析 通过调查与试验,取得原始资料,输入计算机excelexcel表格表格。例1:为了调查马氏珠母贝的生长情况,测量某养殖场三笼马氏珠母贝的总重(g),共获得128个数据,结果如下表。2 试验资料的整理试验资料的整理2.1 原始数据的录入原始数据的录入2 试验资料的整理试验资料的整理2.1 原始数据的输入原始数据的输入 通过调查与试验,取得原始资料,输入计算机excelexcel表格表格。例1:为了调查马氏珠母贝的生长情况,测量某养殖场三笼马氏珠母贝的总重(g),共获得128个数据,结果如下表。五笼珍珠贝的壳高(SH)测量数据,共227个三笼马氏珠母贝
2、的总重(g),共获得128个数据 在一列中输入数据,其中第一行输在一列中输入数据,其中第一行输入标题入标题“总重总重(g)”(图)。(图)。在一列中输入数据,其中第一行输在一列中输入数据,其中第一行输入标题入标题“总重总重(g)”(图)。(图)。2.2 绘制频数分布图绘制频数分布图 频数分布图是直观反映数据分布情况的一种常用方法。将数据按照一定的规则分成不同的组,组数用k 表示;同一个组中的数值属于同一范围,组内包含的个体个数称为频数(f);总频数或样本容量n可用公式表示为 ,频率为f/n。以128个马氏珠母贝壳高测量值为例,制作频数分布表与频数分布图。编制连续型数据的频数分布图的一般步骤是:
3、f2.2.1 Excel(1)确定极差R 从原始数据中找出最大值max(x)和最小值min(x),计算极差(range,R)(也称组距),R=max x-min x;R=76.77-20.47=56.30(2)确定组数L 组数L与样本容量n有关,一般数据少于100个时,可以分为7-10组。数据较多时,可以分为15-20组。可以用以下公式 计算:21010log/log1nL2.2.1 Excel(2)确定组数L 也可以参照下表进行。本例中n=128,L可以先取10。样本容量n组数L306058601007101002009122005001018500以上15302.2.1 Excel(3)确
4、定组距I i=R/L=56.30/10=5.636 一般组距不要取小数点多的数。(4)确定组中值 第一个组中值等于或小于样本最小值+1/2组距,本例最小值为20.47,组距为6,第一个组中值=20+3=23;其余的中值依次加组距确定。2.2.1 Excel(5)在excel中确定接受区域 第一个数=第一个组中值+1/2组距 =23+3=26,下面的数依次加组距,接受区域最后一个值一定大于等于最大值:2.4.1 Excel(6)调用函数FREQUENCY()第一步,选中“频数”列下方的空白单元格,作为结果输出区域,输入“=frequency(”;第二步,用鼠标选中“总重(g)”的128个观测值(
5、或直接输入数据所在单元格“a2:a129”),再输入“,”隔开;第三步,再用鼠标选中选中“接受区域”的数据(或直接输入接受区域单元格“h2:h129”),输入“)”。2.4.1 Excel按“Ctrl+Shift+Enter”,获得结果。2.4.1 Excel(7)制作频数分布图选择频数的数据,点击菜单上的图表向导按钮:(8)选择柱形图中的第一个图,点击“下一步”,出现如下对话框:(9)点击系列,切换对话框,点击)点击系列,切换对话框,点击“分类分类(X)轴标志轴标志(T)”的按钮的按钮:(10)出现)出现“分类分类(X)轴标志轴标志”的对话框,选的对话框,选中中“组中值组中值”数据数据(11
6、)点击)点击“分类分类(X)轴标志轴标志”对话框,返对话框,返回对话框回对话框(12)点击)点击“下一步下一步”(13)点击)点击“标题标题”,在,在“分类分类(X)轴与数值轴与数值(Y)轴轴”分别输入标题分别输入标题“总重总重(g)”和和“频数频数”(14)点击)点击“图例图例”,将,将“显示图例显示图例”前面内的前面内的去掉去掉(16)鼠标选中条形,右键“数据系列格式”(17)出现对话框,点击“选项”,将分类间距150改为0(18)点击“确定”,条形之间的间隔就没有了2.2.2 Minitab绘制频数分布图绘制频数分布图将观测值数据从Excel拷贝到Minitab的工作表中,调用菜单图形直
7、方图,跳出对话框,选择简单:2.2.2 Minitab点击确定,对话框中,点击数据C1 总重(g),选择进入图形变量:2.2.2 Minitab点击确定,即会输出图形:2.2.2 Minitab默认的直方图,分成12组,组距是5。如果想改变分组,可以用鼠标左击一下灰色的直方条,右键,选择编辑条形:2.2.2 Minitab出现编辑条形的对话框,点击区间,在区间定义处点击区间数,右侧输入10:2.2.2 Minitab按确定后,输出的图形的分组数就是10了,组距也变成了6:2.2.2 Minitab将鼠标移到任意一个直方条,就会显示该处的频数值与区间,底部x轴对应数值就是组中值。如下图,鼠标移至
8、最高的直方条,即会显示区间为4147,组中值为44,频数为28。2.2.2 Minitab图中只显示一半的组中值,如要显示全部的组中值,可以点击上方线条,待鼠标显示“X 尺度”2.2.2 Minitab然后点击鼠标右键,选择“编辑X尺度”2.2.2 Minitab调出“编辑X尺度”对话框,选择“刻度位置”,在后面空格填入所需要显示的组中值2.2.2 Minitab点击确定,输入的直方图结果就有了全部10个组的组中值。如果需要每个直方条显示出频数,可以选择任意直方条,点击鼠标右键“添加”“数据标签”2.2.2 Minitab对话框默认选项是“使用Y值作标签”2.2.2 Minitab点击“确定”
9、,输出图形中的直方条上方都已出现了频数2.2.3 DPS 先将数据从Excel中拷贝到DPS,选择数据,菜单数据分析频次分布,对话框中输入分组数:2.2.3 DPS 弹出对话框:2.2.3 DPS点击OK,就可跳出频次分布和理论分布对话框:2.2.4 6SQ统计统计6SQ统计插件for Excel 2.0(http:/ 6SQ统计统计在Excel选中需要分析的数据,包括第一行的名称。调用菜单,6SQ统计基本统计描述统计图形化汇总:2.2.4 6SQ统计统计我们可以将区间宽度改为6,将第一个组下限改为20,其他数据就会立即跟着改变:2.2.4 6SQ统计统计结果:2.4.4 6SQ统计统计结果2
10、:2.3 茎叶图茎叶图 茎叶图(Stem and leaf plot)又称“枝叶图”,它的基本思路是将样本中的数据按位数进行比较,将数的大小基本不变或变化不大的位变化不大的位作为一个主干主干(茎),将变化大的位变化大的位的数作为分枝分枝(叶),列在主干的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少。这里仍然以128只马氏珠母贝总重数据为例制作茎叶图,可以用Minitab、SPSS等软件。2.5.1 Minitab从Excel中导入数据,鼠标点击菜单图形茎叶图:2.5.1 Minitab结果解读:从结果中可以得到,样本容量为128,叶的单位是1.0,也就是将观测值通过四舍五入
11、取整了。茎叶图有三列数。左边的一列是频数频数;中间一列是茎茎,这里就是测量值的十位数十位数;右边的是数组中的变化位,它是按照大小顺序将测量值的个位数个位数一一列出来,象一条枝上抽出的叶子一样,所以人们形象地叫它茎叶图。2.5.1 Minitab结果解读:频数第一个是5,茎是2,叶是01234,表明2024范围内的观测值有5个,分别是20、21、22、23、24共5个。频数第二个是9,茎是2,叶是6789,表明2629范围内的观测值有4个(本行的9减去上一行的5),分别是26、27、28、29共4个。第三个频数是25,茎是3,叶是0011111223333444,表明3034范围内的观测值有16
12、个(25-9),分别是30、30、31、31、31、31、31、32、32、33、33、33、33、34、34、34共16个。2.5.1 Minitab结果解读:依次类推,直到带括号的中心的数(26),表示中位数中位数在此频数在此频数在该行在该行,4449范围内的观测值有26个。从中心数往下,当前行的观测值个数等于当前频数减去下一行频数,如倒数第四行,该行观测值数量有5个(本行的7减去下一行的2),分别是61、62、62、62、63。2.5 茎叶图茎叶图 茎叶图是一个与直方图相类似的特殊工具,但又与直方图不同,茎叶图保留原始资料的资讯,直方图则失去原始资料的讯息。将茎叶图茎和叶逆时针方向旋转9
13、0度,实际上就是一个直方图,可以从中统计出次数,计算出各数据段的频率或百分比。从而可以看出分布是否与正态分布或单峰偏态分布逼近。2.5.2 SPSS导入Excel工作表,直接获得数据。调用菜单分析探索:2.5.2 SPSSSPSS的茎叶图同样也是左、中、右三列,每列的频数直接就是该组的频数,如第三行的16,表示在3034范围内的观测值共有16个,分别是30、30、31、31、31、31、31、32、32、33、33、33、33、34、34、34。最后一行表示有一个值异常(=77)。2.2 数据描述统计数据描述统计 对于样对于样1个样本的观测值,我们可以计算它个样本的观测值,我们可以计算它的的平
14、均数、中位数、众数、最大值、最小平均数、中位数、众数、最大值、最小值、极差、方差、标准差、变异系数值、极差、方差、标准差、变异系数等,等,我们称为对数据进行我们称为对数据进行描述统计描述统计。2.2.1 平均数平均数 平均数(平均数(mean)一般指算术平均数,是观测)一般指算术平均数,是观测值的总和除以样本容量得到,常用值的总和除以样本容量得到,常用 表示。表示。在在Excel中,有专门的函数可以计算平均数:中,有专门的函数可以计算平均数:average()。在数据列最后的空白单元格。在数据列最后的空白单元格($A$130)中输入)中输入“average(”,即会出现以,即会出现以下提示:下
15、提示:x2.2.1 平均数平均数 选中所有数据,输入右括号选中所有数据,输入右括号“)”,即会出,即会出现以下:现以下:2.2.1 平均数平均数 按回车键后,单元格按回车键后,单元格$A$130即会出现平均即会出现平均数的计算结果数的计算结果44.31:2.2.1 平均数平均数 样本容量样本容量n的计算函数:的计算函数:count(),如计算,如计算例例1的样本容量的样本容量n,可在单元格,可在单元格$A$130输入输入“=count(A2:a129)”:2.2.1 平均数平均数 回车,即可得到结果,回车,即可得到结果,n=128:平均数与每一个观测值都有关系,有较高的代表平均数与每一个观测值
16、都有关系,有较高的代表性,但它也容易受到极端值的影响。性,但它也容易受到极端值的影响。2.2.2 中位数中位数 中位数(中位数(Median)是把一组观测值按从小到大的)是把一组观测值按从小到大的数序排列,在中间的一个数(或两个数的平均值)数序排列,在中间的一个数(或两个数的平均值)叫做这组数据的中位数,记作叫做这组数据的中位数,记作Md。当样本数为奇。当样本数为奇数时,中位数数时,中位数=第第(n+1)/2个数据;当样本数为偶个数据;当样本数为偶数时,中位数为第数时,中位数为第n/2个数据与第个数据与第n/2+1个数据的个数据的算术平均值。算术平均值。2.2.2 中位数中位数 在在Excel
17、中,有专门的函数可以计算平均数:中,有专门的函数可以计算平均数:median()。如计算例。如计算例1的样本的中位数,的样本的中位数,可在数据列最后的空白单元格(可在数据列最后的空白单元格($A$130)中输入中输入“median(”,即会出现以下提示:,即会出现以下提示:2.2.2 中位数中位数 选中所有数据,输入右括号选中所有数据,输入右括号“)”,即会出,即会出现以下:现以下:2.2.2 中位数中位数 按回车键后,单元格按回车键后,单元格$A$130即会出现平均即会出现平均数的计算结果数的计算结果45.20:2.2.2 中位数中位数 中位数不受分布数列的极大或极小值影响,具有中位数不受分
18、布数列的极大或极小值影响,具有“抗性抗性”,不像算术平均数那样,不像算术平均数那样“敏感敏感”。存在极端值的资料不宜用平均数,像收入、住存在极端值的资料不宜用平均数,像收入、住房等,数据比较分散,如果存在两极分化严重,房等,数据比较分散,如果存在两极分化严重,就不适宜用平均数。如某公司的就不适宜用平均数。如某公司的33名职工的月工名职工的月工资资(以元为单位以元为单位)如下:如下:本例中,该公司的平均工资数为本例中,该公司的平均工资数为3500,而中位数工资数,而中位数工资数为为1500。2.2.3 众数众数 众数(众数(Mode)是一组数据中出现次数最多的数)是一组数据中出现次数最多的数值,
19、有时众数在一组数中有好几个。值,有时众数在一组数中有好几个。在在Excel中,有专门的函数可以计算平均数:中,有专门的函数可以计算平均数:mode()。在数据列最后的空白单元格(。在数据列最后的空白单元格($A$130)中输入中输入“mode(”,即会出现以下提示:,即会出现以下提示:2.2.3 众数众数 选中所有数据,输入右括号选中所有数据,输入右括号“)”,即会出,即会出现以下:现以下:2.2.3 众数众数 按回车键后,单元格按回车键后,单元格$A$130即会出现平均即会出现平均数的计算结果数的计算结果48.80:2.2.3 众数众数 众数不受极端值的影响,但它也没有利用众数不受极端值的影
20、响,但它也没有利用全部数据信息,而且还具有不惟一性。如全部数据信息,而且还具有不惟一性。如果样本数据的分布没有明显的集中趋势或果样本数据的分布没有明显的集中趋势或最高峰点,也可能没有众数;如果有两个最高峰点,也可能没有众数;如果有两个最高峰点,那就有两个众数。只有在总体最高峰点,那就有两个众数。只有在总体单位比较多,而且又明显地集中于某个变单位比较多,而且又明显地集中于某个变量值时,计算众数才有意义。量值时,计算众数才有意义。2.2.3 众数众数 例:某制鞋厂要了解消费者最需要哪种型例:某制鞋厂要了解消费者最需要哪种型号的男皮鞋,调查了某百货商场某季度男号的男皮鞋,调查了某百货商场某季度男皮鞋
21、的销售情况,得到资料如下表:皮鞋的销售情况,得到资料如下表:从表中看出,25.5厘米的鞋号销售量最多,如果我们计算算术平均数,则平均号码为25.65厘米,这是没有实际意义的,因此利用用25.5(众数)厘米作为样本数据集中趋势,既便捷又符合实际。2.2.4 几何平均数几何平均数 几何平均数(几何平均数(geometric mean)是指)是指n个个观测值连乘积的观测值连乘积的n次方根就是几何平均数,次方根就是几何平均数,记作记作G。根据资料的条件不同,几何平均数。根据资料的条件不同,几何平均数分为加权和不加权之分。分为加权和不加权之分。nnnnxxxxxxG12121)(2.2.4 几何平均数几
22、何平均数 例例 1994-1998年我国工业品的产量分别是年我国工业品的产量分别是上年的上年的107.6%、102.5%、100.6%、102.7%、102.2%,计算这,计算这5年的平均发展年的平均发展速度。速度。%1.103%100022.1*027.1*006.1*025.1*076.15G2.2.4 几何平均数几何平均数 在在Excel中,有专门的函数可以计算平均数:中,有专门的函数可以计算平均数:geomean()。在数据列最后的空白单元格。在数据列最后的空白单元格中输入中输入“geomean(”,即会出现以下提示:,即会出现以下提示:2.2.4 几何平均数几何平均数 选中所有数据,
展开阅读全文