管理数量方法与分析-第一章-数据分析1课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《管理数量方法与分析-第一章-数据分析1课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 数量 方法 分析 第一章 数据 课件
- 资源描述:
-
1、按计量层次按计量层次分分类类型型 数数据据顺顺序序型型数数据据数数值值型型数数据据按时间状况按时间状况截截面面的的数数据据时时序序的的数数据据按收集方法按收集方法观观察察的的数数据据试试验验的的数数据据 收集的统计数据往往是杂乱无章的,需收集的统计数据往往是杂乱无章的,需要进行整理,常用的方法是分组。要进行整理,常用的方法是分组。 根据变量自身变动的特点和研究问题的需根据变量自身变动的特点和研究问题的需要,可以将变量的取值分组,以便更好的研究要,可以将变量的取值分组,以便更好的研究变量取值(数据)分布的特征与变动规律。变量取值(数据)分布的特征与变动规律。分组方法分组方法等距分组等距分组异距分
2、组异距分组单项式分组单项式分组组距分组组距分组 组距分组组距分组 若变量是离散型变量或连续型变若变量是离散型变量或连续型变量,变量取值的个数较多时,采取组距分组量,变量取值的个数较多时,采取组距分组. .将将变量值的一个区间作为一组变量值的一个区间作为一组。组距分组。组距分组需遵循需遵循“不重不漏不重不漏”的原则的原则。见书见书P2P2表表1-21-2组距分组组距分组可采用等距分组可采用等距分组, ,也可采用不等距分组也可采用不等距分组变量数列变量数列-在在对变量值进行分组的基础上,将对变量值进行分组的基础上,将各组不同的变量值与其变量值出现的次数排列成各组不同的变量值与其变量值出现的次数排列
3、成的数列称为变量数列的数列称为变量数列. .分为单项式数列与组距数分为单项式数列与组距数列列. .见书见书P2P2表表1-11-1,1-21-2。 构成变量数列两要素构成变量数列两要素 组别、组别、频数频数或频率或频率频数频数 变量值在该组出现的次数变量值在该组出现的次数. .是一个绝对量是一个绝对量频率频率 变量值在该组出现的次数与变量值的总次变量值在该组出现的次数与变量值的总次数之比,称为比率也称频率数之比,称为比率也称频率. .是一个相对量是一个相对量频数与频率在进行数据分析时起到权数的作用频数与频率在进行数据分析时起到权数的作用1.1.单项式变量数列的编制单项式变量数列的编制例例1.1
4、.11.1.1 某市场调查公司在某个城市居民区某市场调查公司在某个城市居民区的的2020户居民户居民进行一项调查,调查项目是每套住宅的房进行一项调查,调查项目是每套住宅的房间数,结果如下:间数,结果如下:3 3 2 2 4 4 4 4 1 1 6 6 3 3 6 6 6 6 6 6 5 5 7 7 5 5 2 2 7 7 5 5 4 4 6 6 8 8 4 4试根据上述资料对其原始数据按单项式数列进行编制试根据上述资料对其原始数据按单项式数列进行编制房间数房间数12345678频数频数12243521频率频率1/202/202/204/203/205/202/201/202) 2) 确定组数:
5、组数的确定应以能够显示数据确定组数:组数的确定应以能够显示数据的分布特征和规律为目的的分布特征和规律为目的. . 2. 2. 组距数列的编制组距数列的编制 在实际进行等距分组时在实际进行等距分组时, ,可以按可以按 Sturges Sturges 提提出的经验公式来确定组数出的经验公式来确定组数m mnnmlg322. 312lglg1 说明说明若每组组距相等称等距分组若每组组距相等称等距分组, ,否则称为异距分组。否则称为异距分组。一个组的最大值一个组的最大值一个组的最小值一个组的最小值4 4)统计出各组的上限、下限、组中值、频数并编)统计出各组的上限、下限、组中值、频数并编制变量数列制变量
6、数列. . 组距组距( (最大值最大值 - - 最小值最小值) ) 组数组数 下限与上限之间的中点值即组中值下限与上限之间的中点值即组中值=(=(上限上限+ +下限下限)/2)/2组限的表示方法组限的表示方法 若离散型变量若离散型变量, ,相邻两组中数值小的组相邻两组中数值小的组上限与数值大的组下限分别取相邻的两个整数;若是上限与数值大的组下限分别取相邻的两个整数;若是连续型变量或可取整数也可取小数的离散型变量连续型变量或可取整数也可取小数的离散型变量, ,相邻相邻两组中数值小的组上限与数值大的组下限用同一个值。两组中数值小的组上限与数值大的组下限用同一个值。但不违反互斥性原则但不违反互斥性原
7、则. .一般规定上限不包含在本组内,一般规定上限不包含在本组内,即即 ( )。)。例例1.1.21.1.2 书书P4 P4 例题例题1.11.1解解 将将6060位顾客的购物金额按从小到大的顺序位顾客的购物金额按从小到大的顺序排列排列( (略略) )minmin=12.0, =12.0, maxmax=151.0 =151.0 n n=60,=60,利用利用SturgesSturges的的经验公式来确定组数经验公式来确定组数m m760lg322. 31 m根据最大值、最小值与分组组数确定组距根据最大值、最小值与分组组数确定组距19.86712.0-151.0- 组组数数最最小小值值最最大大值
8、值d适当放大最大值或缩小最小值与分组组数使适当放大最大值或缩小最小值与分组组数使组距为组距为2020a a=10=10minmin=12,=12,将最大值将最大值151.0151.0归到最大组,此组归到最大组,此组是开口组即无上限。计算各组上下限、组中值。是开口组即无上限。计算各组上下限、组中值。再计算各组的频数与频率,编制变量数列。再计算各组的频数与频率,编制变量数列。购物金额购物金额顾客数顾客数(频数频数)比率比率(频率频率)%组中值组中值1030711.72030501525.04050701220.0607090813.38090110915.010011013058.3120130以
9、上以上46.7140合计合计60100例例1.1.3 1.1.3 某电脑公司某电脑公司20022002年前四个月各天的销售年前四个月各天的销售量数据量数据( (单位单位: :台台) )。试试编制变量数列。编制变量数列。 ( (等距分组等距分组) )解解 将将120120天的电脑销售量按从小到大的顺序排天的电脑销售量按从小到大的顺序排列列( (略略) ) minmin=141, =141, maxmax=237 =237 n n=120,=120,利用利用SturgesSturges的经验公式来确定组数的经验公式来确定组数m m10120lg322. 31 m根据最大值、最小值与分组组数确定组距
10、根据最大值、最小值与分组组数确定组距1069.10141-237- 组组数数最最小小值值最最大大值值d适当放大最大值或缩小最小值与分组组数使适当放大最大值或缩小最小值与分组组数使组距为组距为1010。 a a=140=140minmin=141, =141, b b=240=240maxmax=237.=237.计算各组计算各组上下限、组中值。再计算各组的频数与频率,编上下限、组中值。再计算各组的频数与频率,编制变量数列。制变量数列。1.1.累计频数累计频数( (频率频率) )分布数列分布数列累积频数累积频数 各各组组频数的逐级累频数的逐级累计计累积频率累积频率 各各组组频率频率( (比率比率
11、) )的逐级累的逐级累计计向下累向下累计频数计频数( (频率频率) ) 由变量值高的组向变量值由变量值高的组向变量值低的组依次累计频数低的组依次累计频数( (频率频率) )。 常用此。常用此。累计频数与累计频率有累计频数与累计频率有向上与向下累向上与向下累计频数计频数( (频率)频率)向向上上累累计频数计频数( (频率频率) ) 由变量值低的组向变量值由变量值低的组向变量值高的组依次累计频数高的组依次累计频数( (频率频率) ) 。 例例1.1.41.1.4 续例题续例题1.11.1,编制累计频数频率分布表,编制累计频数频率分布表房间数房间数12345678频数频数12243521频率频率1/
12、202/202/204/203/205/20 2/201/20向下累计向下累计频数频数2019171511831向下累计向下累计频率频率20/2019/2017/2015/2011/208/20 3/201/20购物金额购物金额顾客顾客数数(频频数数)比率比率(频率频率)%向下累计向下累计向上累计向上累计频数频数频率频率频数频数频率频率1030711.760100711.730501525.05388.32236.750701220.03863.33456.77090813.32643.3427090110915.01830.0518511013058.3915.05693.8130以上以上4
13、6.746.760100合计合计60100 例例1.1.51.1.5 书书P7 P7 续例题续例题1.21.22.2.累计频数累计频数( (频率频率) )分布曲线分布曲线 累积频数累积频数与与累积频率累积频率可以用分布表表示,可以用分布表表示,也可以用图表示,即分布曲线。也可以用图表示,即分布曲线。 累积分布曲线分为累积分布曲线分为向下累向下累计频数计频数( (频率频率) )分布分布图与图与向向上上累累计频数计频数( (频率频率) ) 分布图。分布图。横轴表示变量,纵轴表示累计频数与累计频率。横轴表示变量,纵轴表示累计频数与累计频率。 见书见书P8 图图1-1 表示例题表示例题1.5的累计频数
14、分布图的累计频数分布图. 3.3.变量数列的常用分布图变量数列的常用分布图 变量分布可以用频数频率分布表表示,也可变量分布可以用频数频率分布表表示,也可以用频数频率分布图表示。以用频数频率分布图表示。 常用的分布图有常用的分布图有 柱形图、直方图、折线图柱形图、直方图、折线图(1 1) 柱形图柱形图 横轴表示变量,纵轴表示频横轴表示变量,纵轴表示频数或频率。用顺序排列的柱状数或频率。用顺序排列的柱状( (线段、长方形、线段、长方形、长方体长方体) )的高低显示各组变量值的频数、频率的的高低显示各组变量值的频数、频率的大小。大小。 见书见书P10 图图1-3 表示频数柱形分布图表示频数柱形分布图
15、.(2) (2) 直方图直方图 横轴表示变量,纵轴表示各组频横轴表示变量,纵轴表示各组频数或频率,或各组频数密度、频率密度。用顺序数或频率,或各组频数密度、频率密度。用顺序排列的各区间上的直方条表示变量在各区间内取排列的各区间上的直方条表示变量在各区间内取值的频数、频率的大小的图形。值的频数、频率的大小的图形。 常用于组距分组的频数、频率分布图。常用于组距分组的频数、频率分布图。 频数密度频数密度= =频数频数/ /组距组距 频率密度频率密度= =频率频率/ /组距组距指各组距内单位区间上的频数与频率,两者常用于指各组距内单位区间上的频数与频率,两者常用于绘制异距分组的分布图。绘制异距分组的分
16、布图。 见书见书P11 图图1-4 表示频数直方图表示频数直方图.140 150210我一眼就看出我一眼就看出来了,销售量来了,销售量在在170170180180之之间的天数最多间的天数最多! !190 200180160 17025201510530220 230 240 (3 3) 折线图折线图也称频数多边形图也称频数多边形图 具体的做法具体的做法 是在直方图的基础上是在直方图的基础上, ,把直方图把直方图顶部的中点顶部的中点( (组中值组中值) )用直线连接起来用直线连接起来;第一个矩第一个矩形的顶部中点通过竖边中点形的顶部中点通过竖边中点( (即该组频数一半的位即该组频数一半的位置置)
17、 )连接到横轴连接到横轴, ,最后一个矩形顶部中点与其竖边最后一个矩形顶部中点与其竖边中点连接到横轴中点连接到横轴,折线图的两个终点要与横轴相折线图的两个终点要与横轴相交交, ,再把原来的直方图抹掉再把原来的直方图抹掉。 折线图下所围成的面积与直方图的面积相等,折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的二者所表示的频数分布是一致的。 与直方图类似用于组距分组的频数、频率分与直方图类似用于组距分组的频数、频率分布图。常用的是纵轴为频率密度的折线图。布图。常用的是纵轴为频率密度的折线图。 见书见书P12 图图1-5 表示频数折线图。表示频数折线图。折线图与直方图折线图与直
18、方图下的面积相等!下的面积相等!140 150210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图190200180160 170220 230240频频数数(天天)25201510530续例题续例题1.1.3(直方图的绘制)(直方图的绘制) 4.4.洛伦兹曲线洛伦兹曲线 洛伦兹曲线洛伦兹曲线为了研究国民收入在国民之间为了研究国民收入在国民之间的分配问题的分配问题, ,美国统计学家美国统计学家M.O.M.O.洛伦兹(洛伦兹(Max Otto Max Otto LorenzLorenz,1901905 5年提出的年提出的。 洛伦兹曲线用以比较和分析一个国家在不同洛伦兹曲线用以比较和分析
展开阅读全文