大数据应用场景-大数据预测课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据应用场景-大数据预测课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 应用 场景 预测 课件
- 资源描述:
-
1、大数据应用场景之大数据应用场景之- -大数据预测大数据预测01011PPT学习交流目录目录CONTENTSCONTENTS021 1大数据预测概述2 2描述性数据分析3 3诊断性数据分析4 4大预测性数据分析5 5处方式数据分析6 6数据分析示例7 7大数据预测度特征8 8大数据的其他功能应用领域2PPT学习交流PART 01 PART 01 大数据预测概述大数据预测概述大数据预测是大数据最核心的应用,大数据预测将传统意义预测拓展到“现测”。03033PPT学习交流预测是大数据的核心价值预测是大数据的核心价值0404大数据预测是大数据最核心的应用l大数据的本质是解决问题,大数据的核心价值就在于
2、预测,而企业经营的核心也是基于预测所做出的正确判断。4PPT学习交流大数据预测的优势大数据预测的优势0505l大数据预测则是基于大数据和预测模型去预测未来某件事情的概率,让分析从“面向已经发生的过去”转向“面向即将发生的未来”是大数据与传统数据分析的最大不同l大数据预测的优势体现在它把一个非常困难的预测问题,转化为一个相对简单的描述问题,而这是传统小数据集根本无法企及的l从预测的角度看,大数据预测所得出的结果不仅仅得到处理现实业务简单、客观的结论,更能用于帮助企业经营决策,收集起来的资料还可以被规划,引导开发更大的消费力量5PPT学习交流数据分析的四个层次数据分析的四个层次0606l数据分析的
3、根本目的就是要洞察数据背后的规律,企业可以基于数据分析的结果制订决策、并采取相应措施和行动,进而达成想要的结果l数据分析的四个层次描述性分析(Descriptive Analysis)诊断性分析(Diagnostic Analysis)预测性分析(Predictive Analysis)处方性分析(Prescriptive Analysis)6PPT学习交流数据分析的四个层次数据分析的四个层次07077PPT学习交流描述性分析描述性分析发生了什么发生了什么0808l描述性分析主要是对已经发生的事实用数据做出准确的描述l比如某企业本月订单签约额比上月增加100万,至1100万,但是订单履约率从上
4、月的98%下降到了95%,库存周转率从上月的0.8下降到了0.78PPT学习交流诊断性分析诊断性分析为什么会发生为什么会发生0909l通过评估描述型数据,诊断分析工具能够让数据分析师深入地分析数据,钻取到数据的核心l比如经过分析,发现订单履约率下降的原因是成品生产不出来,无法完成交付,而成品生成不出来的原因则是部分原材料的供应商未能按时送货,导致原材料不齐套,无法开始生产9PPT学习交流预测性分析预测性分析什么可能会发生什么可能会发生1010l预测型分析对事件未来发生的可能性,预测一个可量化的值,或者是预估事情发生的时间点l比如通过建模可以预测本月该供应商会使我们的订单履约率下降2%10PPT
5、学习交流处方性分析处方性分析该做些什么该做些什么1111l处方性分析基于对“发生了什么”、“为什么会发生”和“可能发生什么”的分析,来帮助用户决定应该采取什么措施l通常情况下,是在前面的所有方法都完成之后,最后需要完成的分析方法l比如,供应商A会导致本月订单履约率下降,可能采取的措施就是把A换掉,但是现在有B和C两个供应商供选择,通过分析和计算得出:选用供应商B会比选C的订单履约率高1%,因此建议选择供应商B11PPT学习交流数据分析方法总结数据分析方法总结1212l传统分析方法只能完成描述性和诊断性分析l大数据分析方法使用大量多样化和可变数据来实现预测,在充满不确定性的环境下,能够帮助企业做
6、出更好的决定l大数据预测是大数据在很多领域的重要应用12PPT学习交流PART 02 PART 02 描述性数据分析描述性数据分析描述性分析做为商业数据分析的第一个层次,主要回答发生了什么的问题。131313PPT学习交流描述性分析描述性分析1414l描述性分析对采集到的大量数据进行初步的整理和归纳,对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析数据的集中趋势分析数据的离散程度分析数据的分布统计图形绘制14PPT学习交流数据的频数分析数据的频数分析1515l利用频数分析可以发现一些统计规律l比如说,被调查者使用个人支票支付方式的最多,使用信用卡支付的最少15PPT学习交流数
7、据的集中趋势分析数据的集中趋势分析1616数据的集中趋势分析是用来反映数据的一般水平l平均值:是衡量数据的中心位置的重要指标,反映了一些数据必然性的特点,包括算术平均值、加权算术平均值、调和平均值和几何平均值 l中位数:是反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数l众数:是指在数据中发生频率最高的数据值l如果各个数据之间的差异程度较小,用平均值就有较好的代表性l如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性16PPT学习交流数据的离散程度分析数据的离散程度分析1717l数据的离散程度分析主要是用来反映数
8、据之间的差异程度,常用的指标有方差和标准差l方差是标准差的平方,根据不同的数据类型有不同的计算方法17PPT学习交流数据的分布数据的分布1818l在统计分析中,通常要假设样本的分布属于正态分布,因此需要用偏度和峰度两个指标来检查样本是否符合正态分布偏度衡量的是样本分布的偏斜方向和程度而峰度衡量的是样本分布曲线的尖峰程度l如果样本的偏度接近于0,峰度接近于3,就可以判断总体的分布接近于正态分布18PPT学习交流绘制统计图绘制统计图1919l绘制统计图:用图形的形式来表达数据,比用文字表达更清晰、更简明l绘制各个变量的统计图形,包括条形图、饼图和折线图等19PPT学习交流描述性分析方法描述性分析方
9、法2020l了解业务场景首先要了解和还原数据产生的业务场景,包括:数据涉及到的部门和岗位,这些部门和岗位之间的业务流程,在不同业务流程中有哪些输入,对数据做了什么处理,又是如何输出和传递给下游部门的l探索性分析1.提问,理顺初步分析思路和目标2.收集数据3.选择相应分析方法l提炼指标对数据做探索性分析后,可对数据反映的事实有一个直观的感受,但是要想更准确、简洁地描述发生了什么,还应该进行总结和提炼出相应指标,做为企业日常经营管理的KPI比如描述库存周转的整体情况,库存周转率、库存周转天数等指标更有效20PPT学习交流探索性分析步骤探索性分析步骤21211. 提问,理顺初步分析思路和目标在了解清
10、楚数据产生的业务场景后,试问一些what happened的问题比如,本月销售额是多少?环比和同比变化分别是多少?本财年销售的变化趋势是怎么样的?2. 收集数据有了初步的分析思路和目标以后,就可以确定需要收集哪些数据了比如销售额分析可能用到的数据为销售订单数据、销售开票数据3. 选择相应分析方法根据分析的思路和目标,就可以对收集到的数据选择相应的分析方法了。具体的方法包括:对数据位置的探索,包括:最大值、最小值、均值、中位数、分位数等对数据分布的探索,包括:偏差、方差、标准差、茎叶图、直方图、箱形图、密度图等对数据趋势的探索,包括:同比、环比、趋势图、条形图等对数据聚合的探索,包括:排序、筛选
11、、计数、重复项、分组、求和、比例、条形图、饼图等21PPT学习交流PART 03 PART 03 诊断性数据分析诊断性数据分析诊断性分析可以明确到底发生了什么。222222PPT学习交流诊断性分析诊断性分析2323诊断性分析的目的是明确为什么发生1. 寻找相关特征首先需要知道和结果可能相关的因素有哪些,这依赖于对业务的了解程度,只要是可能相关的,都纳入考虑,也可以基于现有特征构造新特征2. 相关性分析列出和结果可能相关的特征后,就需要验证这些特征和结果到底是否相关3. 因果性分析诊断性分析就是要找到事物的因果关系,即因果性分析所谓因果性,假设X是因,Y是果,则只要X出现,必然会导致Y的发生23
12、PPT学习交流相关性分析相关性分析2424二维散点图l若分析的仅是一个特征与结果的相关性,则可以通过画二者的二维散点图进行分析,通过图形描述,可以初步且直观判断二者的存在何种相关关系:正相关、负相关、无关;如果相关的话,是线性相关还是非线性相关(抛物线、指数等)。左图为不同性别年龄与身高关系的散点图,可以看出在青少年时期,这二者是呈线性正相关的24PPT学习交流相关性分析相关性分析2525矩阵散点图l当有多个特征与结果相关的情况时需要矩阵散点图进行分析。l其实质就是针对每一个特征与结果分别做二维散点图,以分析其相关性。25PPT学习交流因果性分析因果性分析2626l 诊断性分析的隐含意思就是要
13、找到事物的因果关系,即因果性分析l 所谓因果性,假设X是因,Y是果,则只要X出现,必然会导致Y的发生26PPT学习交流PART 04 PART 04 预测性数据分析预测性数据分析预测性分析可以明确未来会发生什么。272727PPT学习交流预测性分析预测性分析2828l预测性分析试图基于历史数据来预测未来的结果l预测性分析的步骤:建立预测模型,模型评估和预测28PPT学习交流预测性分析第一步:建立模型预测性分析第一步:建立模型292929PPT学习交流预测性分析第二步:用模型进行预测预测性分析第二步:用模型进行预测303030PPT学习交流预测性分析的数据挖掘算法预测性分析的数据挖掘算法3131
14、回归分析模型SVM神经网络31PPT学习交流预测性分析的数据挖掘算法预测性分析的数据挖掘算法3232回归分析模型一元回归多元回归非线性回归线性回归非线性回归线性回归两个及两个以上自变量一个自变量32PPT学习交流回归分析的一般步骤回归分析的一般步骤333333PPT学习交流一元线性回归分析示例一元线性回归分析示例3434l 例1:已知工作年限与收入的额关系如下表所示。1. 问题:当工作年限为10年时,年收入是多少?2. 问题:当工作年限为25年时,年收入是多少?34PPT学习交流能够用货币计量能够用货币计量3535l 由最小二乘法可得到对应的一元线性回归为:y=3.5*x+23.235PPT学
15、习交流一元线性回归分析示例一元线性回归分析示例3636l 问题:当工作年限为10年时,年收入是多少?p 将工作年限10带入一元线性回归方程中,可预测出对应的年收入为Y=3.5*10+23.2=58.2l 问题:当工作年限为25年时,年收入是多少?p 将工作年限25带入一元线性回归方程中,可预测出对应的年收入为Y=3.5*25+23.2=110.7。36PPT学习交流PART 05 PART 05 处方式分析处方式分析处方式分析给出问题的解决方案和行动建议。处方式分析回答的问题是:为了解决这个问题,我们该做些什么?或者说,为了达到某个目标,我们该朝哪个方向努力?373737PPT学习交流处方式分
16、析处方式分析3838l处方式分析给出问题的解决方案和行动建议l处方式分析回答的问题是:为了解决这个问题,应该做些什么?或者说,为了达到某个目标,该朝哪个方向努力?38PPT学习交流处方式分析的步骤处方式分析的步骤39391. 首先,进行描述性分析,通过描述性分析明确现状和问题,及业务人员和管理人员的需求,这样才能做到有的放矢2. 其次,进行诊断性分析,寻找和当前问题相关的特征,并对其进行建模3. 最后,根据不同的业务场景和需求,给出具体的解决方案和行动建议39PPT学习交流处方式分析的方法处方式分析的方法4040预测性分析l有些情况,仅使用诊断性分析和预测性分析的模型,即可以给出建议l比如银行
17、可根据申请人的基本信息,包括学历、收入、是否有车、是否有住房、存款金额、是否有违约记录等,去建立模型预测其信用违约的风险有多大,进而给出建议是否要给这个申请人发放信用卡,如果要发放,信用卡的额度又该是多少40PPT学习交流处方式分析的方法处方式分析的方法4141仿真l仿真就是通过建模模拟真实世界的系统或流程,并通过不同的输入参数或条件查看其对结果的影响,据此制订相应决策l主要是通过在电脑上做数学建模仿真,进而根据仿真结果给出相应的解决方案和行动建议l比如企业的成本支出和客户服务水平是一个两难问题,往往成本的削减意味着客户服务水平的下降,那如果说企业要制订年度成本削减目标,通过仿真发现成本降低5
18、%,但是客户服务水平仅下降1%,属于可接受范围,但是当成本降低10%时,客户服务水平下降达6%,可能对公司的经营、商誉等产生重大影响,则此时成本降低5%是相对合适的,而10%就不是那么合适了。41PPT学习交流处方式分析的方法处方式分析的方法4242最优化l最优化是应用数学的一个分支,主要指在一定限制条件下,选取某种研究方案使目标达到最优的一种方法l最优化问题在当今的军事、工程、管理、商业等领域有着极其广泛的应用l比如,企业都希望利润尽量高,那如何在现实的约束条件下,达到上述目标就是一个普遍的最优化问题l最优化常用的方法为线性规划、非线性规划、凸优化、整数规划、网络流优化(物流、电网、通讯网络
展开阅读全文