大数据与物流讲课讲稿课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据与物流讲课讲稿课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 物流 讲课 讲稿 课件
- 资源描述:
-
1、大数据与物流沈庆琼沈庆琼物流教研室物流教研室你脑海中的大数据是什么?一、大数据的内涵一、大数据的内涵 二、大数据的应用二、大数据的应用 三、大数据给物流带来什么三、大数据给物流带来什么导入案例美国零售商和怀孕预测最早关于大数据的故事发生在美国第二大超市塔吉特百货。孕妇对零售商来说是个含金量很高的顾客群体,但是她们一般会去专门的孕妇商店。人们一提起塔吉特,往往想到的都是日常生活用品,却忽视了塔吉特有孕妇需要的一切。在美国,出生记录是公开的,等孩子出生了,新生儿母亲就会被铺天盖地的产品优惠广告包围,那时候再行动就晚了,因此必须赶在孕妇怀孕前期就行动起来。塔吉特的顾客数据分析部门发现,怀孕的妇女一般
2、在怀孕第三个塔吉特的顾客数据分析部门发现,怀孕的妇女一般在怀孕第三个月的时候会购买很多无香乳液。几个月后,她们会购买镁、钙、锌等月的时候会购买很多无香乳液。几个月后,她们会购买镁、钙、锌等营养补充剂营养补充剂。根据数据分析部门提供的模型,塔吉特制订了全新的广告营销方案,在孕期的每个阶段给客户寄送相应的优惠券。结果,孕期用品销售呈现了爆炸性的增长。2002年到2010年间,塔吉特的销售额从440亿美元增长到了670亿美元。大数据的巨大威力轰动了全美。我们可以想象的是,许多孕妇在浑然不觉的情况下成了塔吉特的忠实拥趸,许多孕妇产品专卖店也在浑然不知中破产。商家们早晚要面对的一个问题就是:究竟是在浑然
3、不觉中崛起,还是在浑然不觉中灭亡?一、大数据的内涵一、大数据的内涵 1、定义:“大数据大数据”是一个体量特别大,数据类别特别大的数是一个体量特别大,数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。行抓取、管理和处理。麦肯锡报告:大数据是指其大小超出了典型数据库软件麦肯锡报告:大数据是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集合。的采集、储存、管理和分析等能力的数据集合。奥巴马政府:未来的新石油奥巴马政府:未来的新石油一、大数据的内涵一、大数据的内涵 2、数据来源 物联网、云计算
4、、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器。请问:(1.)写在磁带、纸上的数据是大数据么?有用吗?(2)滴滴打车要用到一个交通路况数据,需要用到什么样的数据?(3)为什么今天的淘宝数据值钱了?一、大数据的内涵一、大数据的内涵 今天的数据不是大,真正有意思和值钱的是数据今天的数据不是大,真正有意思和值钱的是数据变得在线了,这个恰恰是互联网的特点。所以变得在线了,这个恰恰是互联网的特点。所以 在线在线 的这个问题,远远比的这个问题,远远比“大大”更反映本质。更反映本质。大数据的本质大数据的本质一、大数据的一、大数据的内涵内涵 3、大数据的技术支持(1)Hado
5、op平台 互联网企业的海量数据采集工具,有Facebook开源的Scribe、LinkedIn开源的Kafka、淘宝开源的 Timetunnel、Hadoop的Chukwa等,将这些数据上载到Hadoop中央系统进行处理分析。(2)MapReduce分析 大多数互联网企业采用Hadoop的HDFS分布式文件系统来存储数据,并使用MapReduce进行分析 MapReduce目前最擅长的计算领域有流量统计、推荐引擎、趋势分析、用户行为分析、数据挖掘分类器、分布式索引等。例如淘宝开源的 Timetunnel 例如在淘宝,每天有1000多台服务器生成日志文件,日志总量大概有10TB,每天成千上万的报
6、表基于这些数据进行计算。有的报表每半小时计算 一次,有的报表每天计算一次,还有些非报表应用需要实时进行数据分析。如何保证这些报表和应用按时收到自己需要的数据?每天10TB的数据该如何管理?淘宝实时数据传输平台-Timetunnel就是因这些需求而诞生的,目前在淘宝Timetunnel使用三台服务器服务所有的应用,每秒钟实测流 入流量峰值为50MB/S(压缩后),流出流量为130MB/S(压缩后)。Timetunnel保证为所有的报表按时准备好所需数据,延迟不超过1分 钟;保证为所有的实时应用提供实时数据,延迟不超过1秒。MapReduceMapReduce在用户行为上体现的价值在用户行为上体现
7、的价值一分钟内,微博推特上新发的数据量超过10万;社交网络“脸谱”的浏览量超过600万.这些庞大数字,意味着什么?MapReduceMapReduce用户行为体现的价值用户行为体现的价值它意味着,一种全新的致富手段也许就摆在面前,它的价值堪比石油和黄金石油和黄金。具体有六大价值:华尔街根据民众情绪抛售股票;对冲基金依据购物网站的顾客评论,分析企业产品销售状况;银行根据求职网站的岗位数量,推断就业率;投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;美国疾病控制和预防中心依据网民搜索,分析全球范围内流感等病疫的传播状况;美国总统奥巴马的竞选团队依据选民的微博,实时分析选民对总统竞选人的喜好
8、。例如:用户行为分析 美国华尔街德温特资本市场公司首席执行官保罗美国华尔街德温特资本市场公司首席执行官保罗霍霍廷每天的工作之一,就是利用电脑程序分析全球廷每天的工作之一,就是利用电脑程序分析全球3.43.4亿微博亿微博账户的留言,进而判断民众情绪,再以账户的留言,进而判断民众情绪,再以“1”1”到到“50”50”进进行打分。根据打分结果,霍廷再决定如何处理手中数以百行打分。根据打分结果,霍廷再决定如何处理手中数以百万美元计的股票。万美元计的股票。霍廷的判断原则很简单:如果所有人似乎都高兴,那霍廷的判断原则很简单:如果所有人似乎都高兴,那就买入;如果大家的焦虑情绪上升,那就抛售。就买入;如果大家
展开阅读全文