大数据项目实施.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据项目实施.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 项目 实施
- 资源描述:
-
1、大数据项目实施什么是全球数据仓库领导者计什么是全球数据仓库领导者计划?划?What about GDWL program?2什么是全球数据仓库领导者计划?What about GDWL program?我们与全球主要的数据仓库和大数据客户一起工作我们与全球主要的数据仓库和大数据客户一起工作We are working all around the world with key Data Warehouse and Big Data customers我们观察到许多客户的项目实施我们观察到许多客户的项目实施We have seen many customers implementations我们
2、看到很多成功的例子,也有并不如此成功的我们看到很多成功的例子,也有并不如此成功的We have seen successful examples and not so successful我们帮助哪些并不特别成功的客户迈向成功我们帮助哪些并不特别成功的客户迈向成功We helped second category to became the first今天我们也将利用全球客户的经验来描述大数据之旅如何迈向成今天我们也将利用全球客户的经验来描述大数据之旅如何迈向成功功Today I will use world wide customers experience to describe how
3、looks like Big Data Journey对我来说,精彩的演示对我来说,精彩的演示 并不是自己完成的,而是和我们的客户并不是自己完成的,而是和我们的客户一起一起Brilliant presentation for me noting to do myself,just compile customers slides3为什么我们要谈论这个话题?为什么我们要谈论这个话题?Why we are going to talk about this?42012年的大数据年的大数据 Big Data in 2012 5年前大数据引发了大量的年前大数据引发了大量的热议热议5 year ago t
4、erm Big Data have created a lot of buzz 每个人都在谈论它,但只有每个人都在谈论它,但只有很少的客户真的做了一些事很少的客户真的做了一些事情情Everyone was talking about it,but only very few customers really did something 这就像是淘金热!这就像是淘金热!it was like a golden rush!5淘金热 Gold Rush62012 甚至许多人认为并相信,甚至许多人认为并相信,“大数据大数据”是灵丹妙药,是灵丹妙药,可以治疗任何疾病并解决可以治疗任何疾病并解决任何问题任
5、何问题And many people thought and believed,that“big data”is magic pill,which could treat any disease and resolve any problem72014年的大数据年的大数据 Big Data in 2014 2年后人们意识到大数据不是年后人们意识到大数据不是万能的万能的2 years late people realized,that Big Data is not something sacral 其中一些人感到失望其中一些人感到失望Some of them got disappointed
6、更多人开始做一些事情,如运更多人开始做一些事情,如运行新的项目行新的项目Other people start doing something,running new and new projects 正如正如Gartner预测的那样预测的那样All as Gartner predicts82016年的大数据年的大数据 Big Data in 2016 2年后大数据已经从炒作年后大数据已经从炒作循环曲线中消失循环曲线中消失2 years late Big Data has disappeared from the hype cycle curve 现在它是一个技术堆栈,现在它是一个技术堆栈,被许
7、多客户所使用!被许多客户所使用!Now its a technology stack,which used by many customers!9什么是什么是“大数据项目大数据项目”?What is the“big data project”?10什么是什么是“大数据项目大数据项目”?What is the big data project?1)不要将大数据项目视为技术替代项目。它是技术演变。其中一个情况:有些客户开始打算启动将所有关不要将大数据项目视为技术替代项目。它是技术演变。其中一个情况:有些客户开始打算启动将所有关系数据库,并将其替换为大数据系数据库,并将其替换为大数据(Hadoop,
8、NoSQL.)1)Dont think about Big Data project as replacement project.Its evolution.There are some customers,who start with intention to kick-off all relational databases and replace it with Big Data(Hadoop,NoSQL).One of the story:*时间表时间表-2014年:年:“我们的我们的CIO定义了目标定义了目标-用新的大数据技术取代所有关系数据库用新的大数据技术取代所有关系数据库”(
9、C)一家香港公)一家香港公司司*Timeline 2014:“Our CIO define the goal replace all relational databases with new big data technologies”(C)Hong Kong Based company*时间线时间线-2015年:年:“我们开始实施我们开始实施.过了一段时间,我们意识到,考虑到我们的技术资源,这样做几乎过了一段时间,我们意识到,考虑到我们的技术资源,这样做几乎是不可能的。是不可能的。我们不是谷歌,也没有我们不是谷歌,也没有100位开发人员维护这个解决方案位开发人员维护这个解决方案“(C)同一
10、家香港公司)同一家香港公司*Timeline 2015:“We started implementation and after a while,we realized that its almost impossible to do this,given our technical resources.We are not Google and dont have 100s of the developers for maintain this solutions”(C)Hong Kong Based company*时间线时间线-2016:“我们开始考虑混合解决方案,比如我们开始考虑混合解
11、决方案,比如Hadoop或或NoSQL等现代大数据技术对传统技术的补等现代大数据技术对传统技术的补充(而不是取而代之)充(而不是取而代之)”(C)还是这家香港公司)还是这家香港公司*Timeline 2016:“We start thinking about hybrid solution,like complement(instead replacing)to the traditional technologies by modern Big Data technologies,such as Hadoop or NoSQL”(C)Hong Kong Based company11参考架构
12、参考架构(Reference architecture)12数据摄取Data Ingestion信息解释Information Interpretation访问和性能层Access&Performance Layer基础数据层Foundation Data Layer原始数据Raw Data Reservoir数据引擎和多结构数据源数据引擎和多结构数据源Data Engines&Poly-structured sources内容内容Content文档 Docs网络和社交媒体网络和社交媒体Web&Social MediaSMS结构化数据源结构化数据源StructuredDataSources运营
13、数据(Operational Data)COTS数据(COTS Data)流数据和BAM(Streaming&BAM)不可变的原始数据,原始数据不需要解释Immutable raw data reservoirRaw data at rest is not interpreted不可改变的建模数据。业务流程中性形式。从业务流程变更中抽象出来Immutable modelled data.Business Process Neutral form.Abstracted from business process changes过去,现在和将来的企业数据解读。结构化以支持敏捷的访问和导航Past,
14、current and future interpretation of enterprise data.Structured to support agile access&navigation发现探索实验室沙箱Discovery Lab Sandboxes快速开发沙箱Rapid Development Sandboxes基于项目的数据存储以支持特定的数据发现和探索目标Project based data stores to support specific discovery objectives基于项目的数据存储,以促进快速内容/展现交付Project based data stored
15、 to facilitate rapid content/presentation delivery数据源 Data Sources主数据和参考数据源主数据和参考数据源Master&ReferenceData SourcesHDFS 读架构读架构HDFS Schema on read甲骨文数据库甲骨文数据库-写架构写架构Oracle Database Schema on write企业数据服务企业数据服务(Enterprise Data Service)提供高质量的数据环境,为不同的用户群体提供有意义的信息和商业智能,以获得特定的业务成果Delivering a high quality da
16、ta environment that provides meaningful information and business intelligence to a diverse user community in order to achieve specific business outcomes13金Gold业务验证的计算和转换业务验证的计算和转换被确定为对质量至关重要被确定为对质量至关重要管理和制定以适应商业实管理和制定以适应商业实践践Business validated computations and transformationsIdentified as critical t
17、o qualityManaged and formulated to fit business practices集成的,结构化的,集成的,结构化的,定义的定义的Integrated,Structured,Defined经过业务认证和验证,经过业务认证和验证,管理人员定义关键数据管理人员定义关键数据质量信息质量信息 Business Certifed and validated Stewards define critical to quality data profile银SilverIT数量验证(收到的数据是数数量验证(收到的数据是数据加载的)据加载的);IT针对源系统进行针对源系统进行了
18、验证了验证;IT格式认证(空值,数格式认证(空值,数字与字符,与源系统相同的质字与字符,与源系统相同的质量)量)IT Quantity validation(data received is data loaded);IT validated against source systems;IT format certified(nulls,number vs char,same quality as source system)最小操纵的数据最小操纵的数据Minimally manipulated data铜Bronze数据直接来源于数据源数据直接来源于数据源Data directly fro
19、m sourceLG CNS 大数据业务扩张(Big Data Business Expansion)14主动预测predictive被动响应Reactive业务创新业务创新(物联网等物联网等)New Biz Creation(IoT)I.智慧商务智能智慧商务智能/数据仓库数据仓库I.Smart BI/DW传统商务智能/数据仓库Tradition BI/DW业务分析业务分析“解决问题解决问题”Business Analytics Problem Solving大数据大数据/混合混合架构架构Big Data/Hybrid ArchitectureIII.大数据分析(如社交媒体分大数据分析(如社交
20、媒体分析)析)III.Big Data Analytics(Social Media Analytics)II.混合信息架构混合信息架构II.Hybrid Information ArchitectureLG CNS是众多客户之是众多客户之一,他们对传统数据仓一,他们对传统数据仓库进行了现代化改造库进行了现代化改造LG CNS is one of the many customers,who made a modernization of the traditional Data Warehouse架构架构信息架构模型分层描述信息架构模型分层描述Garanti银行银行 智能和分析平台智能和分析
21、平台全数据管理平台:更好的洞察力,实时供应,降低风险全数据管理平台:更好的洞察力,实时供应,降低风险阿尔法银行阿尔法银行 Alfa Bank什么是大数据项目?什么是大数据项目?What is the big data project?1)不要将大数据项目视为关于替换项目。它是技术演变技术演变。Dont think about Big Data project as about replacement project.Its evolution.2)新技术(大数据)允许存储更多数据。如果以前的方式是:“考虑你加载到数据库中的内容”,现在它已经被转换为:“把你拥有的所有数据放在Hadoop(数据池
22、)层上”。您对加载到系统中的数据所需要做的选择性会降低。这是关于数据量数据量New technologies(Big Data)allows to store more data.If previous philosophy was:“think what do you load into Database”,now it have been converted into:“Put everything you have on the Hadoop(Data pool)tier”.You could be less selective with data that you load into
23、the system.its about volume3)这意味着您可以将更多可变数据可变数据存储到您的单一系统(非结构化,半结构化,结构化)It means that you may store more variable data into your single system(unstructured,semi-structured,structured)18Hadoop允许存储大量数据,SunTrust从单一逻辑位置的不同来源获取数据Hadoop allows to store big amount of data,which SunTrust gets from different
24、sources in single logical place甲骨文大数据数据量增长甲骨文大数据数据量增长(Oracle Big Data Growth Volumes)假设持续增长,未压缩估计,不包括假设持续增长,未压缩估计,不包括HDFS复制复制Assumed consistent growth,Uncompressed estimates,Not including HDFS replication国际足联正试图预测足球(足球)比赛中的欺诈行为,因此他们需要来自不同来源的信息,这些信息来自不同的格式。Hadoop允许轻松将其放置在HDFS上FIFA is trying to predic
25、t fraud in football(soccer)games,from this they need information from different sources,which they got in different formats.Hadoop allows easily land it on the HDFS运动数据相关的初始需求运动数据相关的初始需求范围将是:赛程和现场比分(黄牌和红牌,罚球.)球队排队桌子/表格比赛对抗过去的球队比赛(友谊赛,杯赛等)所有4名裁判(裁判员,边裁等)球员和球队的表现通过完成情况跑步距离铲球情况犯规.投注相关信息预期值澳大利亚能源公司的传统架构
展开阅读全文