次数分布和平均数课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《次数分布和平均数课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 次数 分布 平均数 课件
- 资源描述:
-
1、第三章第三章 次数分布和平均数、变异数次数分布和平均数、变异数第一节第一节 总体及其样本总体及其样本第二节第二节 次数分布次数分布第三节第三节 平均数平均数第四节第四节 变异数变异数第五节第五节 理论总体理论总体(群体群体)的平均数和标准差的平均数和标准差第一节第一节 总体及其样本总体及其样本l 总体总体(population)(population)-具有共同性质的个体所组成的集团具有共同性质的个体所组成的集团.有限总体有限总体-总体所包含的个体数目有无穷多个总体所包含的个体数目有无穷多个.无限总体无限总体-由有限个个体构成的总体由有限个个体构成的总体.l 观察值观察值(observatio
2、n)(observation)-每一个体的某一性状、特性的测每一个体的某一性状、特性的测定数值定数值.l 变数变数(variable)(variable)-观察值集合起来,称为总体的变数。观察值集合起来,称为总体的变数。变数又称为随机变数变数又称为随机变数(random variable)。l样本样本(sample)(sample)-从总体中抽取若干个个体的集合称为样从总体中抽取若干个个体的集合称为样本本(sample)。l统计数统计数(statistic)(statistic)-测定样本中的各个体而得的样本特征测定样本中的各个体而得的样本特征数,如平均数等,称为统计数数,如平均数等,称为统计
3、数(statistic)。l随机样本随机样本(random sample)(random sample)-从总体中随机抽取的样本称从总体中随机抽取的样本称为随机样本为随机样本(random sample)l样本容量样本容量 (sample size)(sample size)-样本中包含的个体数称为样本样本中包含的个体数称为样本容量或样本含量容量或样本含量(sample size)第二节第二节 次数分布次数分布一、试验资料的性质与分类一、试验资料的性质与分类二、次数分布表二、次数分布表三、次数分布图三、次数分布图一、试验资料的性质与分类一、试验资料的性质与分类(一一)数量性状资料数量性状资料(
4、二二)质量性状资料质量性状资料(一一)数量性状资料数量性状资料 数量性状数量性状(quantitative trait)的度量有计数和量测两种的度量有计数和量测两种方式,其所得变数不同。方式,其所得变数不同。1.不连续性或间断性变数不连续性或间断性变数(discontinuous or discrete(discontinuous or discrete variable)variable)指用计数方法获得的数据指用计数方法获得的数据。2.连续性变数连续性变数(continuous variable)(continuous variable)指称量、度量或测指称量、度量或测量方法所得到的数据,
5、其各个观察值并不限于整数,在两个量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。数值之间可以有微量数值差异的第三个数值存在。(二二)质量性状资料质量性状资料 质量性状质量性状(qualitative trait)(qualitative trait)指能观察而不能量测的状指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料,可有无、绒毛的有无等。要从这类性状获得数量资料,可采用下列两种方法:采用下列两种方法:1.统计次数法统计次数法 于一
6、定总体或样本内,统计其具有某个性于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。次数或相对次数。2.给分法给分法 给予每类性状以相对数量的方法给予每类性状以相对数量的方法二、次数分布表二、次数分布表(一一)间断性变数资料的整理间断性变数资料的整理(二二)连续性变数资料的整理连续性变数资料的整理(三三)属性变数资料的整理属性变数资料的整理(一一)间断性变数资料的整理间断性变数资料的整理 现以某小麦品种的每穗小穗数为例,随机采取现以某小麦品种的每穗小穗数为例,随机采取100个麦穗,计数每穗小穗数,未
7、加整理的资料列个麦穗,计数每穗小穗数,未加整理的资料列成表成表3.1。表3.1 100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917每穗小穗数每穗小穗数(y)次数次数(f)1561615173218251917205总次数总次数
8、(n)100表表3.2 100个麦穗每穗小个麦穗每穗小穗数的次数分布表穗数的次数分布表 从表从表3.2中看到,一堆杂乱的原中看到,一堆杂乱的原始资料表始资料表3.1,经初步整理后,就,经初步整理后,就可了解资料的大致情况,另外,经可了解资料的大致情况,另外,经过整理的资料也便于进一步的分析。过整理的资料也便于进一步的分析。上述资料为间断性变数资料,上述资料为间断性变数资料,每穗小穗数在每穗小穗数在1520的范围内变动,的范围内变动,把所有观察值按每穗小穗数多少加把所有观察值按每穗小穗数多少加以归类,共分为以归类,共分为6组,组与组间相差组,组与组间相差为为1小穗,称为小穗,称为组距组距。这样可
9、得表。这样可得表3.2形式的次数分布表。形式的次数分布表。(二二)连续性变数资料的整理连续性变数资料的整理兹以表兹以表3.4的的100行水稻试验的产量为例,说明整理方法。行水稻试验的产量为例,说明整理方法。177 215 197 97123 159 245 119 119 131 149 152 167 104161 214 125 175 219 118 192 176 175 95136 199 116 165214 9515883137 80138 151 187 126 196 134 206 137 98 97129 143 179 174 159 165 136 108 101 1
10、41 148 168163 176 102 194 145 173 75130 149 150 161 155 111 158131 189 91142 140 154 152 163 123 205 149 155 131 209183 97119 181 149 187 131 215 111 186 118 150 155 197116 254 239 160 172 179 151 198 124 179 135 184 168 169173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 1
11、59 177 147 194 227 141 169 124 159表表3.4 140行水稻产量行水稻产量(单位:克单位:克)具体步骤:具体步骤:1.数据排序数据排序(sort)(sort)首先对数据按从小到大排列首先对数据按从小到大排列(升序升序)或从大到小排列或从大到小排列(降序降序)。2.求极差求极差(range)(range)所有数据中的最大观察值和最小所有数据中的最大观察值和最小观察值的差数,称为观察值的差数,称为极差极差,亦即整个样本的变异幅度。,亦即整个样本的变异幅度。从表从表3.4中查到最大观察值为中查到最大观察值为254g,最小观察值为,最小观察值为75g,极差为极差为254
12、75=179g。3.确定组数和组距确定组数和组距(class interval)(class interval)根据极差分为若根据极差分为若干组,每组的距离相等,称为干组,每组的距离相等,称为组距组距。在确定组数和组距在确定组数和组距时应考虑:时应考虑:(1)观察值个数的多少;观察值个数的多少;(2)极差的大小;极差的大小;(3)便于计算;便于计算;(4)能反映出资料的真实面貌等方面。能反映出资料的真实面貌等方面。样本大小样本大小(即样本内包含观察值的个数的多少即样本内包含观察值的个数的多少)与组与组数多少的关系可参照数多少的关系可参照表表3.5来确定。来确定。表3.5样本容量与组数多少的关系
13、样本内观察值的个数分组时的组数50 510100 81620010203001224500153010002040 组数确定后,还须组数确定后,还须确定组距。组距确定组距。组距=极差极差/组数。以表组数。以表3.4中中140行行水稻产量为例,样本内水稻产量为例,样本内观察值的个数为观察值的个数为140,查表查表3.5可分为可分为816组,组,假定分为假定分为12组,组,则组距为则组距为179/12=14.9g,为分组方便起见,可以,为分组方便起见,可以15g作为组距。作为组距。4.选定组限选定组限(class limit)(class limit)和组中点值和组中点值(组值,组值,class
14、value)class value)以表以表3.4中中140行水稻产量为例,选定第一组的中点行水稻产量为例,选定第一组的中点值为值为75g,与最小观察值,与最小观察值75g相等;则第二组的中点值为相等;则第二组的中点值为75+15=90g,余类推。,余类推。各组的中点值选定后,就可以求得各组组限。每组各组的中点值选定后,就可以求得各组组限。每组有两个组限,数值小的称为有两个组限,数值小的称为下限下限(lower limit)(lower limit),数值大的,数值大的称为称为上限上限(upper limit)(upper limit)。上述资料中,第一组的下限为该。上述资料中,第一组的下限为
15、该组中点值减去组中点值减去1/2组距,即组距,即75(15/2)=67.5g,上限为中,上限为中点值加点值加1/2组距,即组距,即75+(15/2)=82.5g。故第一组的组限为。故第一组的组限为67.582.5g。按照此法计算其余各组的组限,就可写出。按照此法计算其余各组的组限,就可写出分组数列。分组数列。5.把原始资料的各个观察值按分组数列的各组组限归组把原始资料的各个观察值按分组数列的各组组限归组 可按原始资料中各观察值的次序,逐个把数值归于各可按原始资料中各观察值的次序,逐个把数值归于各组。组。待全部观察值归组后,即可求得各组的次数,制成一待全部观察值归组后,即可求得各组的次数,制成一
16、个次数分布表。个次数分布表。例如表例如表3.4中第一个观察值中第一个观察值177应归于表应归于表3.6中第中第8组,组,组限为组限为172.5187.5;第二个观察值;第二个观察值149应归于第应归于第6组,组组,组限为限为142.5157.5;。依次把。依次把140个观察值都进行归个观察值都进行归组,即可制成组,即可制成140行水稻产量的次数分布表行水稻产量的次数分布表(表表3.6)。表3.6 140行水稻的次数分布组组 限限中点值中点值(y)次数次数(f)67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.51351
17、7142.5157.515020157.5172.516525172.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合计合计(n)140 注注:前面提到分为前面提到分为12组,组,但由于第一组的中点值接近但由于第一组的中点值接近于最小观察值,故第一组的于最小观察值,故第一组的下限小于最小观察值,实际下限小于最小观察值,实际上差不多增加了上差不多增加了1/2组;这样组;这样也使最后一组的中点值接近也使最后一组的中点值接近于最大值,又增加了于最大值,又增加了1/2组,组,故实际的组
18、数比原来确定的故实际的组数比原来确定的要多一个组,为要多一个组,为13组。组。(三三)属性变数资料的整理属性变数资料的整理 属性变数的资料,也可以用类属性变数的资料,也可以用类似次数分布的方法来整理。似次数分布的方法来整理。在整理前,把资料按各种质量性在整理前,把资料按各种质量性状进行分类,分类数等于组数,状进行分类,分类数等于组数,然后根据各个体在质量属性上的然后根据各个体在质量属性上的具体表现,分别归入相应的组中,具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。即可得到属性分布的规律性认识。例如,某水稻杂种第二代植株例如,某水稻杂种第二代植株米粒性状的分离情况,归于表米粒性状的
19、分离情况,归于表3.7。表3.7 水稻杂种二代植株 米粒性状的分离情况属性分组属性分组(y)次数次数(f)红米非糯红米非糯96红米糯稻红米糯稻37白米非糯白米非糯31白米糯稻白米糯稻15合计合计(n)179三、次数分布图三、次数分布图(一一)方柱形图方柱形图(二二)多边形图多边形图(三三)条形图条形图(四四)饼图饼图 (一一)方柱形图方柱形图方柱形图方柱形图(histogram)(histogram)适用于表示连续性变数的次数分布。适用于表示连续性变数的次数分布。607590105 120 135 150 165 180 195 210 225 240 255 270510152025y(产量
20、,克/行)现以表现以表3.6的的140行水稻产量的次数行水稻产量的次数分布表为例加以说分布表为例加以说明。即成方柱形次明。即成方柱形次数分布图数分布图3.1。图图3.1 140行水稻产量次数分布方柱形图行水稻产量次数分布方柱形图(二二)多边形图多边形图 多边形图多边形图(polygon)(polygon)也是表示连续性变数资料的一种普也是表示连续性变数资料的一种普通的方法,且在同一图上可比较两组以上的资料。通的方法,且在同一图上可比较两组以上的资料。607590 105 120 135 150 165 180 195 210 225 240 255 270051015202530y(产量,克/
21、行)仍以仍以140行水稻产量次行水稻产量次数分布为例,所成图形即数分布为例,所成图形即为次数多边形图为次数多边形图(图图3.2)。图图3.2 140行水稻产量次数分布多边形图行水稻产量次数分布多边形图(三三)条形图条形图 条形图条形图(bar)(bar)适用于间断性变数和属性变数资料,用以适用于间断性变数和属性变数资料,用以表示这些变数的次数分布状况。一般其横轴标出间断的中表示这些变数的次数分布状况。一般其横轴标出间断的中点值或分类性状,纵轴标出次数。点值或分类性状,纵轴标出次数。020406080100120红米非糯红米糯稻白米非糯白米糯稻f 现以表现以表3.7水稻杂种第二水稻杂种第二代米粒
展开阅读全文