大数据应用案例分析课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据应用案例分析课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 应用 案例 分析 课件
- 资源描述:
-
1、大数据应用案例分析目录大数据概念1大数据处理办法2大数据应用案例31大数据概念大大 数数 据据 时时 代代 到到 来来随着智能手机的普及,网民参与互联网产品和使用各种手机应用的程度越来越深,用户的行为、随着智能手机的普及,网民参与互联网产品和使用各种手机应用的程度越来越深,用户的行为、位置、位置、甚至身体生理等每一点变化都成为了可被记录和分析的数据,数据量呈现爆炸式增长。甚至身体生理等每一点变化都成为了可被记录和分析的数据,数据量呈现爆炸式增长。地球上至今总共的数据量:地球上至今总共的数据量:在在2006 年,个人用户才刚刚迈进年,个人用户才刚刚迈进TB时代,时代,全球一共新产生了约全球一共新
2、产生了约180EB的数据;的数据;据据IDC研究机构预测:研究机构预测:到到2020 年,整个世界的数据总量将会增长年,整个世界的数据总量将会增长44 倍,达到倍,达到35.2ZB(1ZB=10 亿亿TB)!)!1PB=250字节字节1EB=260字节字节1ZB=270字节字节GB在在2011 年,这个数字达到了年,这个数字达到了1.8ZB。TBPBEBZB01大大 数数 据据 的的 构构 成成大数据大数据=海量数据(交易数据、交互数据)海量数据(交易数据、交互数据)+针对海量数据处理的解决方案针对海量数据处理的解决方案海量交易数据:海量交易数据:企业内部的经营交易信息主要包括联机交易数据和联
3、机 分析数据,是结构化的、通过关系数据库进行管理和访 问的静态、历史数据。通过这些数据,我们能了解过去 发生了什么。海量交互数据:海量交互数据:源于Facebook、Twitter、微博、及其他来源的社交媒 体数据构成。它包括了呼叫详细记录CDR、设备和传感 器信息、GPS和地理定位映射数据、通过管理文件传输 Manage File Transfer协议传送的海量图像文件、Web 文本和点击流数据、科学信息、电子邮件等等。可以告 诉我们未来会发生什么。海量数据处理:海量数据处理:大数据的涌现已经催生出了设计用于数据密集型处理的 架构。例如具有开放源码、在商品硬件群中运行的 Apache Had
4、oop。注:大数据注:大数据 不仅仅指的是数据量庞大,更为重要的是数据类型复杂不仅仅指的是数据量庞大,更为重要的是数据类型复杂想驾驭这庞大的数据,我们想驾驭这庞大的数据,我们必必 须了解大数据的特征。须了解大数据的特征。02大大 数数 据据 4V 特特 征征03结构化数据、半结构化数据和非结结构化数据、半结构化数据和非结构构化化 数据数据如今的数据类型早已不是单一的文本形式,网络日志、音频、视频、图片、地理位置信息等,对数据的处理 能力提出了更高要求实时获取需要的信息实时获取需要的信息比如:在客户每次浏览页面,每次下订单过程中都会 对用户进行实时的推荐,决策已经变得实时数据量巨大数据量巨大全球
5、在2010 年正式进入ZB 时代,IDC预计到 2020 年,全球将总共拥有35ZB 的数据量沙里淘金,价值密度低沙里淘金,价值密度低虽然数据量很大,但是价值密度较低,如何通过强大 的机器算法更迅速地完成数据价值“提纯”,是目前 大数据亟待解决的难题大数据大数据产品产品市场价值市场价值解解决决方方案案转转化化1.海量(海量(VolumeVolume)3.速度(速度(VelocityVelocity)4.价值(价值(value)2.多样(多样(VarietyVariety)2大数据处理办法用用 户户 画画 像像 体体 系系01每个企业都不可以避免的要对用户进行画像,用户画像的提出,根本上是源于企
6、业对用户认知的需求。每个企业都不可以避免的要对用户进行画像,用户画像的提出,根本上是源于企业对用户认知的需求。产品经理,需要了解用户的特征,对产品进行功能的完善。内容运营人员,需要筛选目标用户,对内容进产品经理,需要了解用户的特征,对产品进行功能的完善。内容运营人员,需要筛选目标用户,对内容进 行精准投放。行精准投放。活跃程度如何?活跃程度如何?年龄分布、区域分布是什么样的年龄分布、区域分布是什么样的?消费习惯和特征是什么?消费习惯和特征是什么?公司在哪?公司在哪?对什么感兴趣?对什么感兴趣?常去的商圈是哪儿?常去的商圈是哪儿?赢利点在哪?赢利点在哪?职业是什么?职业是什么?常住地在哪儿常住地
7、在哪儿?购买能力如何?购买能力如何?基本特征?基本特征?用用 户户 画画 像像 体体 系系02驾驶行为数据将构建精准的车险用户画像性别年龄国籍地理位置开车地点职业驾照类别开车频率开车原因健庩状况医疗条件感知力学习周期消费习惯民族特征教育水平婚姻状态共用车辆情况生活方式使用药物情况酒驾经历疲劳驾驶收入情况碰撞事故车辆维修犯罪记录违章驾驶记录 驾驶时间通过对用户不同维度的大数据分析,最终得出可执行的业务决策。通过对用户不同维度的大数据分析,最终得出可执行的业务决策。基本基本属性属性行为习惯购买 能力心理 特征社交 网络兴趌 爱好基于机器学习的基于机器学习的数据挖掘及分类基本识别流程数据挖掘及分类基
展开阅读全文