大数据解决方案V1044课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据解决方案V1044课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 解决方案 V1044 课件
- 资源描述:
-
1、北京荣之联大数据解决方案目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大数据畅想n 案例大数据大数据时代到来时代到来IDC预测全球的数据使用量到2020年会增长44倍,达到35.2ZB(1ZB=10亿TB)宽带、移动网络普及和提速宽带、移动网络普及和提速移动网络和各种智能终端移动网络和各种智能终端视频视频(医疗影像、地理信息、监控录像等医疗影像、地理信息、监控录像等)统计、分析、预测、实时处理传感器、传感器、RFIDRFID阅读器、导航终端等非传统阅读器、导航终端等非传统ITIT设备设备社交网络社交网络(Facebook,Twitter,(Faceboo
2、k,Twitter,微博等微博等)数据处理思维转变数据处理思维转变少量的样本数据数据关系力求明确清晰探求难以捉摸的因果关系要求数据精确无误全量数据乐于接受数据的纷繁复杂转而关注事物的关联关系数据的精确不是那么重要了 谷歌翻译系统为了训练其系统,收集其能找到的所有翻译;谷歌收集了上万亿页的语料库,包括质量参差不齐的文档;上万亿的语料库,相当于950亿句英语;相对而言,谷歌的翻译质量还是最好的;谷歌翻译之所以更好,不是因为它拥有一个更好的算法机制,而是增加了各种各样的数据,包括有错误的数据;在谷歌的翻译团队中,大多数工程师并不懂其翻译出来的语言;数据处理思维转变数据处理思维转变传统数据分析思维大数
3、据分析思维案例一 聘请了20多名书评家和编辑组成的团队,在网页上创立“亚马逊的声音”向客户推荐新书,写书评;通过客户的购买历史,寻找客户的相似性,对客户分群进行产品推荐,推荐的总是与以往购买的相似或略有区别;通过大量的数据分析,找出书籍之间的关联关系,即“item-to-item”,时亚马逊发生了天翻地覆的变化。AMAZON销售额的三分之一来自于“item-to-item”的推荐系统。AMAZON最终放弃了在线书评,书评团队被解散。案例二数据处理思维转变数据处理思维转变数据处理思维转变 关联关系,预测的关键。很多时候,知道“是什么”就够了,没必要知道“为什么”。一旦我们完成了“关联关系”分析,
4、我们就可以继续向更深层次研究因果关系,找出背后的“为什么”沃尔玛:请把蛋挞和飓风用品摆在一起,请把啤酒和尿片摆在一起;某信用评分公司,利用Facebook的社交圈来预测个人偿还债务的可能性;对冲基金通过分析Twitter微博的数据文本,作为股市投资的信号;某信用评分公司,利用Facebook的社交圈来预测个人偿还债务的可能性;对冲基金通过分析Twitter微博的数据文本,作为股市投资的信号;其它案例大数据与大数据与BIBI融融合合*大数据的商业价值大数据的商业价值大数据大数据主要厂商主要厂商大型企业和机构在寻求解决棘手的大数据问题时,往往会使用开源软件基础架构Hadoop的服务。由于Hadoo
5、p深受欢迎,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop提供解决方案。Hadoop的发行版除了社区的Apache hadoop外,cloudera,IBM,ORACLE等都提供了自己的商业版本。商业版主要是提供Hadoop专业的技术支持,这对一些大型企业尤其重要。ClouderaEMCl。IBMOracle大数据生态Big Data Applications非结构化资料汇入SQL资料汇入分散式档案系统类SQL资料库系统(非即时性)分散式资料库(即时性)并行计算框架资料处理语言数据挖掘程序库目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造
6、业应用大数据畅想n 案例企业大数据平台架构原则*技术-按需频度的数据获取批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-多样化数据共存跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过数据组织与前端应用功能,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。大数大数据据平平台整体架台整体架构构大数大数据处理流程据处理流程a.建立对非结构化数
7、据进行SQL语法查询的支持,实现与结构化数据的集成关联(key)主分类关键词标签地名人名全国统一分类分词,倒排搜索共性、个性文本识别处理功能模块网页分类反向搜索关键词分析日志关联内容分词索引建立索引分析日志合并用户类别标签摘要结构化元信息网页信息分类数据获取语义分析数据解析 非结构化数据数据获取结构化数据数据集市数据集市EDW结构化元数据Hadoopa.建立非结构化信息的标签、摘要、索引、日志、内容等a.提取结构化的元数据信息,如类别、标引、摘要等;实现与结构化数据的整合ODSSQL声誉度分析品牌分析服务质量分析竞争产品分析产品评价市场动态跟踪ETL网络爬虫大大数据关键技术数据关键技术大大数据
8、关键技术数据关键技术-Hadoop-HadoopHadoopHadoop系统工作原理系统工作原理大数据关键技术大数据关键技术-网络数据获取网络数据获取分布式分布式网络爬虫网络爬虫分布式文件系统分布式文件系统分布式存储横向扩容(Scale-out)架构分布式软件架构并行计算框架大数据关键技术大数据关键技术-两种平台相互两种平台相互集成集成大数据关键技术大数据关键技术-数数据据应应用功能用功能数据查询数据统计信息检索数据分析语义分析数据挖掘经营管理市场活动市场口碑分销管理决策支持用户服务大数据关键技术-数据管控目录n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大
9、数据畅想n 案例传统数据平台与大数据分布式传统数据平台与大数据分布式平台特性差异平台特性差异大大数据分析与传统数据分析与传统BIBI分析差异分析差异 结构化数据 数据规模一般为TB规模 集中式,为了分析进行大量数据移动,数据向计算靠近 批处理为主 结构化/非结构化混合分析的能力 数据规模从数十TB到PB级别 分布式,计算向数据靠近 支持流式分析事务关系型数据库批处理数据仓库分析集群化非结构化流式多种数据源分析(MapReduce)组织传统传统BIBI分析分析大数据分析大数据分析大大数据处理和管理体系数据处理和管理体系-多结构多结构化化大数据实施建议第一阶段:应用场景驱动的大数据开发第二阶段:各
10、业务系统、各渠道系统等配合大数据改造优化第三阶段:管理信息体系下的大数据平台建设第四阶段(目标):以大数据驱动的,实时的、整体联动的IT解决方案Think big,start small.大处着眼,小处着手。大大数据实施方法论数据实施方法论大数据业务战略大数据建设目标大数据架构设计大数据实施大数据运维企业战略目标业务目标业务模式大数据治理目标应用场景服务模式服务对象大数据服务定义大数据信息模型大数据管理定义技术选择验证测试容量规划安装,配置验收测试系统上线大数据服务管理服务性能管理生命周期管理资源调度系统监控大数据持续改进业务调整服务改进技术升级架构优化大大数据的角色和技能数据的角色和技能目录
11、n 大数据综述n 荣之联企业大数据平台方案n 大数据平台建设方法n 汽车制造业应用大数据畅想n 案例汽车企业汽车企业ITIT的过去的过去汽车企业汽车企业ITIT的将来的将来业务挑战l产品研发周期响应长l市场扩张不够且竞争激烈l客户忠诚度不高l成本增长且利润率低业务趋势l提升客户服务,增加用户粘度l提高生产率l扩大市场份额l加强集团管控l降低成本l绿色经济新兴技术云(Cloud)移动(Mobility)社交(Social)大数据(Big Data)一体化平台客户体验(CX)汽车制造业大数据能力创新的汽车制造业大数据能力创新的方向方向部分数据开放实时/近实时封闭延时报表/KPI“大”数据更深入大数
展开阅读全文