数据分析的集中常用方法课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据分析的集中常用方法课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 集中 常用 方法 课件
- 资源描述:
-
1、培训要求培训要求统计分析工具统计分析工具v 对帐单(检查表)对帐单(检查表); ;v 流程图;流程图;v 散布图;散布图;v 直方图;直方图;v 排列图;排列图;v 控制图;控制图;v 因果分析图;因果分析图;有一些统计分析工具可供书业公司用来解决经营问题,它们有助于有一些统计分析工具可供书业公司用来解决经营问题,它们有助于收集和分析数据以便为决策提供依据。收集和分析数据以便为决策提供依据。1、什么是数据? 数据是对图书销售业务全过程记录下来的、可以以鉴别的符号。数据是销售业务全过程的属性数量、位置及相通关系等等的抽象表示。数据表现形式数据表现形式表现形式一表现形式一数据列表数据表现形式二数据
2、表现形式二2 24 48 82 26 69 92 22 24 42 24 45 53 38 81 15 59 95 52 25 55 52 25 54 42 23 37 72 21 11 11 17 71 11 16 66 62 24 47 74 42 22 23 30 03 33 32 20 04 41 12 24 42 20 06 66 67 74 47 70 03 36 66 64 41 10 04 40 03 33 33 30 03 34 43 34 47 77 70 01 10 00 02 20 00 03 30 00 04 40 00 05 50 00 06 60 00 07 70
3、 00 08 80 00 01 12 2月月1 1月月2 2月月3 3月月4 4月月5 5月月6 6月月7 7月月8 8月月9 9月月1 10 0月月1 11 1月月1 12 2月月描述性分析:数据分时段走势、差距变化情况以及描述性分析:数据分时段走势、差距变化情况以及 相应的时间背景相应的时间背景销售码洋趋势图销售码洋趋势图数据表现形式三数据表现形式三3 31 1. .0 0% %3 36 6. .2 2% %4 43 3. .4 4% %3 36 6. .4 4% %6 64 4. .3 3% %8 85 5. .3 3% %5 57 7. .5 5% %6 60 0. .2 2% %5
4、53 3. .5 5% %4 47 7. .4 4% %3 39 9. .5 5% %3 35 5. .5 5% %3 33 3. .0 0% %1 13 3. .2 2% %2 21 1. .1 1% %3 30 0. .8 8% %3 36 6. .1 1% %4 49 9. .0 0% %6 67 7. .0 0% %5 51 1. .5 5% %4 47 7. .3 3% %4 43 3. .3 3% %3 37 7. .4 4% %3 30 0. .4 4% %2 25 5. .5 5% %2 27 7. .3 3% %0 0% %1 10 0% %2 20 0% %3 30 0%
5、%4 40 0% %5 50 0% %6 60 0% %7 70 0% %8 80 0% %9 90 0% %1 12 2月月1 1月月2 2月月3 3月月4 4月月5 5月月6 6月月7 7月月8 8月月9 9月月1 10 0月月1 11 1月月1 12 2月月销售码洋结构比销售码洋结构比2、数据分析目的让数据说话;行动的向导;杜绝浪费;提供决策的依据。3、数据的分类按数据的性质一般可归纳为:定性数据。往往用于频数或频率分析。定量型数据。可以用数字量化的数值。按数据的来源可分为:人力资源数据;财务数据;营销数据;采购数据;仓储数据;生产数据;编辑数据。4、运用统计方法应遵循的原则&坚持用数据
6、说话的基本观点。&有目的地收集数据。&掌握数据的来源。&认真整理数据。5 5、统计分析流程、统计分析流程确定问题确定分析目标采用科学方法收集数据考察数据时效性整理数据统计分析出具分析报告,提出解决意或建议5 5、数据分析误区、数据分析误区误区一误区一: :展示元素不宜大于展示元素不宜大于3 3个个0 01 10 00 00 00 00 02 20 00 00 00 00 03 30 00 00 00 00 04 40 00 00 00 00 05 50 00 00 00 00 06 60 00 00 00 00 07 70 00 00 00 00 08 80 00 00 00 00 09 90
7、 00 00 00 00 01 10 00 00 00 00 00 01 12 2月月1 1月月2 2月月3 3月月4 4月月5 5月月6 6月月7 7月月8 8月月9 9月月1 10 0月月1 11 1月月1 12 2月月5、数据分析误区、数据分析误区误区二误区二:时间序列数据最好使用折线图,而不宜使时间序列数据最好使用折线图,而不宜使用柱状图等用柱状图等0 01 10 00 00 00 00 02 20 00 00 00 00 03 30 00 00 00 00 04 40 00 00 00 00 05 50 00 00 00 00 06 60 00 00 00 00 07 70 00 0
8、0 00 00 08 80 00 00 00 00 09 90 00 00 00 00 01 10 00 00 00 00 00 01 12 2月月1 1月月2 2月月3 3月月4 4月月5 5月月6 6月月7 7月月8 8月月9 9月月1 10 0月月1 11 1月月1 12 2月月误区三:研究用数据最好不使用三维立体图研究用数据最好不使用三维立体图1 12 2月月1 1月月2 2月月3 3月月4 4月月5 5月月6 6月月7 7月月8 8月月9 9月月1 10 0月月1 11 1月月1 12 2月月S S1 1S S3 30 01 10 00 00 00 00 02 20 00 00 00
9、 00 03 30 00 00 00 00 04 40 00 00 00 00 05 50 00 00 00 00 06 60 00 00 00 00 07 70 00 00 00 00 08 80 00 00 00 00 09 90 00 00 00 00 01 10 00 00 00 00 00 05、数据分析误区、数据分析误区误区四:为避免图表的欺骗性,图线最好占据误区四:为避免图表的欺骗性,图线最好占据2/3 2/3 至至3/43/4的高度(调整的高度(调整Y Y轴刻度)轴刻度)7 7 3 3 . . 7 7 % %6 6 8 8 . . 1 1 % %6 6 9 9 . . 0 0
10、% %7 7 2 2 . . 9 9 % %7 7 3 3 . . 1 1 % %7 7 5 5 . . 6 6 % %7 7 0 0 . . 9 9 % %7 7 1 1 . . 9 9 % %7 7 1 1 . . 6 6 % %6 6 9 9 . . 0 0 % %6 6 2 2 . . 2 2 % %6 6 7 7 . . 1 1 % %7 7 5 5 . . 7 7 % %8 8 3 3 . . 5 5 % %7 7 1 1 . . 5 5 % %7 7 5 5 . . 4 4 % %7 7 9 9 . . 0 0 % %7 7 5 5 . . 8 8 % %7 7 6 6 . .
11、9 9 % %7 7 4 4 . . 5 5 % %6 6 8 8 . . 9 9 % %7 7 2 2 . . 9 9 % %7 7 7 7 . . 3 3 % %6 6 7 7 . . 7 7 % %7 7 5 5 . . 5 5 % %7 7 9 9 . . 6 6 % %0 0 % %1 1 0 0 % %2 2 0 0 % %3 3 0 0 % %4 4 0 0 % %5 5 0 0 % %6 6 0 0 % %7 7 0 0 % %8 8 0 0 % %9 9 0 0 % %1 1 0 0 0 0 % %1 1 2 2 月月 1 1 月月 2 2 月月 3 3 月月 4 4 月月
12、5 5 月月 6 6 月月 7 7 月月 8 8 月月 9 9 月月 1 1 0 0 月月1 1 1 1 月月1 1 2 2 月月7 73 3. .7 7% %6 68 8. .1 1% %6 69 9. .0 0% %7 72 2. .9 9% %7 73 3. .1 1% %7 75 5. .6 6% %7 70 0. .9 9% %7 71 1. .9 9% %7 71 1. .6 6% %6 69 9. .0 0% %6 62 2. .2 2% %6 67 7. .1 1% %7 75 5. .7 7% %8 83 3. .5 5% %7 71 1. .5 5% %7 75 5. .4
13、 4% %7 79 9. .0 0% %7 75 5. .8 8% %7 76 6. .9 9% %7 74 4. .5 5% %6 68 8. .9 9% %7 72 2. .9 9% %7 77 7. .3 3% %6 67 7. .7 7% %7 75 5. .5 5% %7 79 9. .6 6% %6 60 0% %6 65 5% %7 70 0% %7 75 5% %8 80 0% %8 85 5% %1 12 2月月 1 1月月 2 2月月 3 3月月 4 4月月 5 5月月 6 6月月 7 7月月 8 8月月 9 9月月 1 10 0月月 1 11 1月月 1 12 2月月5、
14、数据分析误区、数据分析误区总体、个体总体、个体总体又叫母体,是研究对象的全体。总体又叫母体,是研究对象的全体。出版商一个批次到货出版商一个批次到货的全部都可以称为总体。的全部都可以称为总体。构成总体的基本单位,称为个体。构成总体的基本单位,称为个体。每册书都是一个个体。每册书都是一个个体。来货检验常用抽样方法进行,即从来货总件数中抽出一部分件数,并来货检验常用抽样方法进行,即从来货总件数中抽出一部分件数,并测试每件的有关册数是否够数的特性数据,进行统计分析后,对总体测试每件的有关册数是否够数的特性数据,进行统计分析后,对总体作出估计和判断。作出估计和判断。样本样本样本样本又叫又叫子样子样,是从
15、总体中抽出来一部分个体的集合。,是从总体中抽出来一部分个体的集合。样本中每个个体叫样本中每个个体叫样品样品,样本中所包含样品数目称为样本大小,样本中所包含样品数目称为样本大小,又叫又叫样本量样本量,常用,常用n n表示。表示。对样本的特性进行测定,所得的数据称为对样本的特性进行测定,所得的数据称为样本值样本值。当样本个数越多时,分析结果越接近总体的值,样本对总体的代当样本个数越多时,分析结果越接近总体的值,样本对总体的代表性就越好。表性就越好。抽样方法抽样方法学用的统计抽样方法主要有以下三种学用的统计抽样方法主要有以下三种随机抽样法随机抽样法分层抽样法分层抽样法系统抽样法系统抽样法书书业业公公
16、司司抽样方法抽样方法随机抽样随机抽样指总体中每一个个体都有同等可能的机会被抽到。这种抽样方法事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签或利用随机数表来抽取样品以保证样品代表性。抽样当图书品种不多时,随机抽样是一种有效的抽样方法;抽样方法抽样方法分层抽样分层抽样分层抽样是先将总体按照研究内容密切有关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。抽样样本当到货产品较多时,分层抽样是一种有效的抽样方法;当到货产品较多时,分层抽样是一种有效的抽样方法;抽样方法抽样方法系统抽样系统抽样从总体中每隔K个个体抽取一个个体的抽样方法,比值K是
17、总体容量N与样本容量n之比;当出版商批量发货及产品特别多时,并且易作某种次序的整理时,当出版商批量发货及产品特别多时,并且易作某种次序的整理时,系统抽样比分层抽样好;系统抽样比分层抽样好; 1, 2, . K K+ 1, K+2, ., 2K 2K + 1, 2K+2, ., 3K 直到 N为止例,从具有1000个个体的总体中抽取50个个体。总体、样本、数据间的关系总体、样本、数据间的关系总体总体样本样本结论结论数据数据抽样分析管理测试数理整理和统计数理整理和统计抽样的目的是通过样本来反映总体。抽样的目的是通过样本来反映总体。在书业公司经营管理中,常常将测试的样本数据,通过整理加工,找在书业公
18、司经营管理中,常常将测试的样本数据,通过整理加工,找出它们的特性,从而推断总体的变化规律、趋势和性质。出它们的特性,从而推断总体的变化规律、趋势和性质。一批数据的分布情况,可以用中心倾向及数据的分散程度来表示,表一批数据的分布情况,可以用中心倾向及数据的分散程度来表示,表示中心倾向的有平均值、中位值等,表示数据分散程度的有方差、标示中心倾向的有平均值、中位值等,表示数据分散程度的有方差、标准偏差、极差等。准偏差、极差等。描述总体数据离散程度的参数为方差描述总体数据离散程度的参数为方差2 2 ,描述总体数据中心倾向的,描述总体数据中心倾向的数为均值数为均值 。若利用样本参数近似描述总体状况时,可
19、以利用样本。若利用样本参数近似描述总体状况时,可以利用样本方差方差S S2 2近似代替总体方差近似代替总体方差2 2,利用样本均值,利用样本均值X X近似代替总体均值近似代替总体均值p p。数理整理和统计数理整理和统计样本平均值样本平均值样本中位值样本中位值X = X1+X2+X3 .+Xnn中位值是按照数据大小顺序排列位于中间的数值,中位值记为X若n为偶数,则取位于中间两个数值的平均值为中位值;数理整理和统计数理整理和统计样本极差样本极差样本方差和样本标准偏差样本方差和样本标准偏差样本方差和样本标准差就是用来度量数据波动幅度大小的一个重要特性值。样本方差是一组数据中每一个数值与平均值之差的平
20、方和的平均值,通常记为S2;样本方差的平方根S称作样本标准偏差,它与样本方差一样,是反映一组数据分散程度的特性值:样本极差表示一组数据分布的范围,是指数据中最大值与最小值的差: R = Xmax - Xmin检查表检查表在书业公司日常管理中最强调的是事实管理,就是要掌握事实,要掌握事实就必须设计检查表收集数据。业务记录用检查表业务记录用检查表层别法层别法层别法是所有手法中最基本的概念,即将多种多样的层别法是所有手法中最基本的概念,即将多种多样的数据,因应用目的的需要分类成不同的数据,因应用目的的需要分类成不同的“类别类别”,使,使之方便以后的分析;之方便以后的分析;采购营销物流财务 其 他公司
21、数据仓库公司数据仓库层别法层别法用在检查表上用在排列图上排列图(帕累拉图)排列图(帕累拉图)关键的少数,次要的多数。通常所说的80/20法则。针对问题所收集的数据按其重要性的顺序,记录在 帕累托分析表中。公司80%的销售来自于20%教辅图书产品。排列图的作用排列图的作用公司要解决的问题很多,但从何入手呢?公司要解决的问题很多,但从何入手呢?事实上,大部分的问题,只要能找出几个影响较大的因素,并加以处置及控制,就可解决问题的80%以上。柏拉图是根据收集的数据,以不良原因、不良状况发生的现象,有系统地加以项目别分类,计算出各项目所产生的数据(如作业准确率、损失金额)及所占的比例,再依照大小顺序排列
展开阅读全文