书签 分享 收藏 举报 版权申诉 / 53
上传文档赚钱

类型大数据项目实施.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4105192
  • 上传时间:2022-11-11
  • 格式:PPTX
  • 页数:53
  • 大小:4.61MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据项目实施.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 项目 实施
    资源描述:

    1、大数据项目实施什么是全球数据仓库领导者计什么是全球数据仓库领导者计划?划?What about GDWL program?2什么是全球数据仓库领导者计划?What about GDWL program?我们与全球主要的数据仓库和大数据客户一起工作我们与全球主要的数据仓库和大数据客户一起工作We are working all around the world with key Data Warehouse and Big Data customers我们观察到许多客户的项目实施我们观察到许多客户的项目实施We have seen many customers implementations我们

    2、看到很多成功的例子,也有并不如此成功的我们看到很多成功的例子,也有并不如此成功的We have seen successful examples and not so successful我们帮助哪些并不特别成功的客户迈向成功我们帮助哪些并不特别成功的客户迈向成功We helped second category to became the first今天我们也将利用全球客户的经验来描述大数据之旅如何迈向成今天我们也将利用全球客户的经验来描述大数据之旅如何迈向成功功Today I will use world wide customers experience to describe how

    3、looks like Big Data Journey对我来说,精彩的演示对我来说,精彩的演示 并不是自己完成的,而是和我们的客户并不是自己完成的,而是和我们的客户一起一起Brilliant presentation for me noting to do myself,just compile customers slides3为什么我们要谈论这个话题?为什么我们要谈论这个话题?Why we are going to talk about this?42012年的大数据年的大数据 Big Data in 2012 5年前大数据引发了大量的年前大数据引发了大量的热议热议5 year ago t

    4、erm Big Data have created a lot of buzz 每个人都在谈论它,但只有每个人都在谈论它,但只有很少的客户真的做了一些事很少的客户真的做了一些事情情Everyone was talking about it,but only very few customers really did something 这就像是淘金热!这就像是淘金热!it was like a golden rush!5淘金热 Gold Rush62012 甚至许多人认为并相信,甚至许多人认为并相信,“大数据大数据”是灵丹妙药,是灵丹妙药,可以治疗任何疾病并解决可以治疗任何疾病并解决任何问题任

    5、何问题And many people thought and believed,that“big data”is magic pill,which could treat any disease and resolve any problem72014年的大数据年的大数据 Big Data in 2014 2年后人们意识到大数据不是年后人们意识到大数据不是万能的万能的2 years late people realized,that Big Data is not something sacral 其中一些人感到失望其中一些人感到失望Some of them got disappointed

    6、更多人开始做一些事情,如运更多人开始做一些事情,如运行新的项目行新的项目Other people start doing something,running new and new projects 正如正如Gartner预测的那样预测的那样All as Gartner predicts82016年的大数据年的大数据 Big Data in 2016 2年后大数据已经从炒作年后大数据已经从炒作循环曲线中消失循环曲线中消失2 years late Big Data has disappeared from the hype cycle curve 现在它是一个技术堆栈,现在它是一个技术堆栈,被许

    7、多客户所使用!被许多客户所使用!Now its a technology stack,which used by many customers!9什么是什么是“大数据项目大数据项目”?What is the“big data project”?10什么是什么是“大数据项目大数据项目”?What is the big data project?1)不要将大数据项目视为技术替代项目。它是技术演变。其中一个情况:有些客户开始打算启动将所有关不要将大数据项目视为技术替代项目。它是技术演变。其中一个情况:有些客户开始打算启动将所有关系数据库,并将其替换为大数据系数据库,并将其替换为大数据(Hadoop,

    8、NoSQL.)1)Dont think about Big Data project as replacement project.Its evolution.There are some customers,who start with intention to kick-off all relational databases and replace it with Big Data(Hadoop,NoSQL).One of the story:*时间表时间表-2014年:年:“我们的我们的CIO定义了目标定义了目标-用新的大数据技术取代所有关系数据库用新的大数据技术取代所有关系数据库”(

    9、C)一家香港公)一家香港公司司*Timeline 2014:“Our CIO define the goal replace all relational databases with new big data technologies”(C)Hong Kong Based company*时间线时间线-2015年:年:“我们开始实施我们开始实施.过了一段时间,我们意识到,考虑到我们的技术资源,这样做几乎过了一段时间,我们意识到,考虑到我们的技术资源,这样做几乎是不可能的。是不可能的。我们不是谷歌,也没有我们不是谷歌,也没有100位开发人员维护这个解决方案位开发人员维护这个解决方案“(C)同一

    10、家香港公司)同一家香港公司*Timeline 2015:“We started implementation and after a while,we realized that its almost impossible to do this,given our technical resources.We are not Google and dont have 100s of the developers for maintain this solutions”(C)Hong Kong Based company*时间线时间线-2016:“我们开始考虑混合解决方案,比如我们开始考虑混合解

    11、决方案,比如Hadoop或或NoSQL等现代大数据技术对传统技术的补等现代大数据技术对传统技术的补充(而不是取而代之)充(而不是取而代之)”(C)还是这家香港公司)还是这家香港公司*Timeline 2016:“We start thinking about hybrid solution,like complement(instead replacing)to the traditional technologies by modern Big Data technologies,such as Hadoop or NoSQL”(C)Hong Kong Based company11参考架构

    12、参考架构(Reference architecture)12数据摄取Data Ingestion信息解释Information Interpretation访问和性能层Access&Performance Layer基础数据层Foundation Data Layer原始数据Raw Data Reservoir数据引擎和多结构数据源数据引擎和多结构数据源Data Engines&Poly-structured sources内容内容Content文档 Docs网络和社交媒体网络和社交媒体Web&Social MediaSMS结构化数据源结构化数据源StructuredDataSources运营

    13、数据(Operational Data)COTS数据(COTS Data)流数据和BAM(Streaming&BAM)不可变的原始数据,原始数据不需要解释Immutable raw data reservoirRaw data at rest is not interpreted不可改变的建模数据。业务流程中性形式。从业务流程变更中抽象出来Immutable modelled data.Business Process Neutral form.Abstracted from business process changes过去,现在和将来的企业数据解读。结构化以支持敏捷的访问和导航Past,

    14、current and future interpretation of enterprise data.Structured to support agile access&navigation发现探索实验室沙箱Discovery Lab Sandboxes快速开发沙箱Rapid Development Sandboxes基于项目的数据存储以支持特定的数据发现和探索目标Project based data stores to support specific discovery objectives基于项目的数据存储,以促进快速内容/展现交付Project based data stored

    15、 to facilitate rapid content/presentation delivery数据源 Data Sources主数据和参考数据源主数据和参考数据源Master&ReferenceData SourcesHDFS 读架构读架构HDFS Schema on read甲骨文数据库甲骨文数据库-写架构写架构Oracle Database Schema on write企业数据服务企业数据服务(Enterprise Data Service)提供高质量的数据环境,为不同的用户群体提供有意义的信息和商业智能,以获得特定的业务成果Delivering a high quality da

    16、ta environment that provides meaningful information and business intelligence to a diverse user community in order to achieve specific business outcomes13金Gold业务验证的计算和转换业务验证的计算和转换被确定为对质量至关重要被确定为对质量至关重要管理和制定以适应商业实管理和制定以适应商业实践践Business validated computations and transformationsIdentified as critical t

    17、o qualityManaged and formulated to fit business practices集成的,结构化的,集成的,结构化的,定义的定义的Integrated,Structured,Defined经过业务认证和验证,经过业务认证和验证,管理人员定义关键数据管理人员定义关键数据质量信息质量信息 Business Certifed and validated Stewards define critical to quality data profile银SilverIT数量验证(收到的数据是数数量验证(收到的数据是数据加载的)据加载的);IT针对源系统进行针对源系统进行了

    18、验证了验证;IT格式认证(空值,数格式认证(空值,数字与字符,与源系统相同的质字与字符,与源系统相同的质量)量)IT Quantity validation(data received is data loaded);IT validated against source systems;IT format certified(nulls,number vs char,same quality as source system)最小操纵的数据最小操纵的数据Minimally manipulated data铜Bronze数据直接来源于数据源数据直接来源于数据源Data directly fro

    19、m sourceLG CNS 大数据业务扩张(Big Data Business Expansion)14主动预测predictive被动响应Reactive业务创新业务创新(物联网等物联网等)New Biz Creation(IoT)I.智慧商务智能智慧商务智能/数据仓库数据仓库I.Smart BI/DW传统商务智能/数据仓库Tradition BI/DW业务分析业务分析“解决问题解决问题”Business Analytics Problem Solving大数据大数据/混合混合架构架构Big Data/Hybrid ArchitectureIII.大数据分析(如社交媒体分大数据分析(如社交

    20、媒体分析)析)III.Big Data Analytics(Social Media Analytics)II.混合信息架构混合信息架构II.Hybrid Information ArchitectureLG CNS是众多客户之是众多客户之一,他们对传统数据仓一,他们对传统数据仓库进行了现代化改造库进行了现代化改造LG CNS is one of the many customers,who made a modernization of the traditional Data Warehouse架构架构信息架构模型分层描述信息架构模型分层描述Garanti银行银行 智能和分析平台智能和分析

    21、平台全数据管理平台:更好的洞察力,实时供应,降低风险全数据管理平台:更好的洞察力,实时供应,降低风险阿尔法银行阿尔法银行 Alfa Bank什么是大数据项目?什么是大数据项目?What is the big data project?1)不要将大数据项目视为关于替换项目。它是技术演变技术演变。Dont think about Big Data project as about replacement project.Its evolution.2)新技术(大数据)允许存储更多数据。如果以前的方式是:“考虑你加载到数据库中的内容”,现在它已经被转换为:“把你拥有的所有数据放在Hadoop(数据池

    22、)层上”。您对加载到系统中的数据所需要做的选择性会降低。这是关于数据量数据量New technologies(Big Data)allows to store more data.If previous philosophy was:“think what do you load into Database”,now it have been converted into:“Put everything you have on the Hadoop(Data pool)tier”.You could be less selective with data that you load into

    23、the system.its about volume3)这意味着您可以将更多可变数据可变数据存储到您的单一系统(非结构化,半结构化,结构化)It means that you may store more variable data into your single system(unstructured,semi-structured,structured)18Hadoop允许存储大量数据,SunTrust从单一逻辑位置的不同来源获取数据Hadoop allows to store big amount of data,which SunTrust gets from different

    24、sources in single logical place甲骨文大数据数据量增长甲骨文大数据数据量增长(Oracle Big Data Growth Volumes)假设持续增长,未压缩估计,不包括假设持续增长,未压缩估计,不包括HDFS复制复制Assumed consistent growth,Uncompressed estimates,Not including HDFS replication国际足联正试图预测足球(足球)比赛中的欺诈行为,因此他们需要来自不同来源的信息,这些信息来自不同的格式。Hadoop允许轻松将其放置在HDFS上FIFA is trying to predic

    25、t fraud in football(soccer)games,from this they need information from different sources,which they got in different formats.Hadoop allows easily land it on the HDFS运动数据相关的初始需求运动数据相关的初始需求范围将是:赛程和现场比分(黄牌和红牌,罚球.)球队排队桌子/表格比赛对抗过去的球队比赛(友谊赛,杯赛等)所有4名裁判(裁判员,边裁等)球员和球队的表现通过完成情况跑步距离铲球情况犯规.投注相关信息预期值澳大利亚能源公司的传统架构

    26、看起来像一个纠结的网络。HDFS是一种数据总线,它可以将所有数据源都放置在那里Legacy architecture of Energy Australia looks like a tangled Web.HDFS is kind of data bus,where they able to land all data sourcesSmart是菲律宾最大的电信运营商之一,它存储结构化数据是菲律宾最大的电信运营商之一,它存储结构化数据-CDR,但数据量巨,但数据量巨大!大!Smart is one of the biggest Telco operator on the Philippine

    27、s,stores pretty structure data CDRs,but volume is huge!初始环境初始环境节点数节点数HDFS总容总容量量回顾什么是大数据项目?回顾什么是大数据项目?What is the big data project?Recap1)不要将大数据项目视为关于替换项目。它是技术演变技术演变。Dont think about Big Data project as about replacement project.Its evolution.2)新技术(大数据)允许存储更多数据。如果以前的方式是:“考虑你加载到数据库中的内容”,现在它已经被转换为:“把你拥

    28、有的所有数据放在Hadoop(数据池)层上”。您对加载到系统中的数据所需要做的选择性会降低。这是关于数据量数据量New technologies(Big Data)allows to store more data.If previous philosophy was:“think what do you load into Database”,now it have been converted into:“Put everything you have on the Hadoop(Data pool)tier”.You could be less selective with data t

    29、hat you load into the system.its about volume3)这意味着您可以将更多可变数据可变数据存储到您的单一系统(非结构化,半结构化,结构化)It means that you may store more variable data into your single system(unstructured,semi-structured,structured)23成功的大数据项目的关键点成功的大数据项目的关键点Key aspects of the successful Big Data Project24成功的大数据项目的关键点成功的大数据项目的关键点 K

    30、ey aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得钱。有没有想过?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到项目。Hard project work is a key success factor.Do

    31、 PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually,customers have many Big Data projects.Its very rare,when someone has one super gold profitable project25一年以来,罗氏进行了一年以来,罗氏进行了许多测试和试点。许多测试和试点。并非并非所有的人都成功了。所有的人都成功了。For one year Roche run many PoC and Pilots.Not all of them have been

    32、successful.大约有大约有20个测试已经发生个测试已经发生/正在进行中正在进行中About 20 PoCs were conducted/being conducted肿瘤图像坐标的空间分析肿瘤图像坐标的空间分析Spatial analysis on tumor images coordinates人力资源人员分析人力资源人员分析HR people analytics新一代测序数据处理新一代测序数据处理Next generation sequencing data processing预测性维护的统计模型预测性维护的统计模型Statistical model for predictiv

    33、e maintenancesTeradata连接器连接器Teradata connector从从2015年开始年开始Since 20155个应用程序个应用程序5 live applications2017年有年有5个新应用程序个新应用程序5 additional apps in 2017项目组合项目组合项目组合项目组合项目类型项目类型Garanti银行经营许多项目,涉及许多业务挑战Garanti bank runs many projects with many divisions,related with many business challenges预警系统下一个最佳供应客户社交网络分析

    34、数据治理客户DNA城市分析数据水池7个支柱成功的大数据项目的关键点成功的大数据项目的关键点 Key aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得钱。有没有想过?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到

    35、项目。Hard project work is a key success factor.Do PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually,customers have many Big Data projects.Its very rare,when someone has one super gold profitable project4)正在成功实施大数据项目的公司通常拥有CDO(首席数据官)来指明方向。通常他/她是权力和决策者的中心Companies,who is doing successf

    36、ul Big Data projects,usually have CDO(Chief Data Officer),who lead this direction.Usually he/she is the center of the power and decision maker5)创新。创建并运行研究实验室和研发部门。技术允许您存储更多数据和更多数据格式。但它本身并不能解决您的业务挑战。Be innovative.Open and run the research labs and R&D.Technologies allow you to store more data and mor

    37、e data formats.But it doesnt solve your business challenges itself.29阿尔法银行创新实验室 Alfa Bank innovative Lab30德意志银行实验室 Deutsche Bank Lab31主题探索主题探索主题生态系统观测技术趋势Deutsche Bank Strategic Roadmap德意志银行策略路线跨行业趋势成功的大数据项目的关键点成功的大数据项目的关键点 Key aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得钱。有没有想过

    38、?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到项目。Hard project work is a key success factor.Do PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually,custom

    39、ers have many Big Data projects.Its very rare,when someone has one super gold profitable project4)正在成功实施大数据项目的公司通常拥有CDO(首席数据官)来指明方向。通常他/她是权力和决策者的中心Companies,who is doing successful Big Data projects,usually have CDO(Chief Data Officer),who lead this direction.Usually he/she is the center of the powe

    40、r and decision maker5)创新。创建并运行研究实验室和研发部门。技术允许您存储更多数据和更多数据格式。但它本身并不能解决您的业务挑战。Be innovative.Open and run the research labs and R&D.Technologies allow you to store more data and more data formats.But it doesnt solve your business challenges itself.6)培育人才。公司内部。在大学里(像Caixa银行一样)Grow up the personnel.Insid

    41、e the company.In the university(like Caixa Bank does)7)让你的系统更加用户友好。更友好就意味着更少的IT工作Make you systems more user friendly.Than more friendly they are,than less work to the IT33Borse集团 Borse GroupIT转型让业务人员能开发IT系统成功的大数据项目的关键点成功的大数据项目的关键点 Key aspects of the successful Big Data Project1)想象一个“钱钮”,只要你按下它,你就会获得

    42、钱。有没有想过?现在忘记吧忘记吧。此按钮不存在!Think about one“money button”,which brings money to you as soon as you press it.Have thought?And now forget.This button doesnt exist!2)艰苦的项目工作是一个关键的成功因素。做测试,试点,到项目。Hard project work is a key success factor.Do PoCs,Pilots,Projects.3)通常,客户会有许多大数据项目。但是有一个超级有利可图的项目却是非常罕见的。Usually

    43、,customers have many Big Data projects.Its very rare,when someone has one super gold profitable project4)正在成功实施大数据项目的公司通常拥有CDO(首席数据官)来指明方向。通常他/她是权力和决策者的中心Companies,who is doing successful Big Data projects,usually have CDO(Chief Data Officer),who lead this direction.Usually he/she is the center of t

    44、he power and decision maker5)创新。创建并运行研究实验室和研发部门。技术允许您存储更多数据和更多数据格式。但它本身并不能解决您的业务挑战。Be innovative.Open and run the research labs and R&D.Technologies allow you to store more data and more data formats.But it doesnt solve your business challenges itself.6)培育人才。公司内部。在大学里(像Caixa银行一样)Grow up the personne

    45、l.Inside the company.In the university(like Caixa Bank does)7)让你的系统更加用户友好。更友好就意味着更少的IT工作Make you systems more user friendly.Than more friendly they are,than less work to the IT8)做数据探索。大数据不仅仅是关于静态报告。你必须探索数据。你必须从数据中挖掘价值Do data Discovery.Big Data its not only about static reporting.You have to explore

    46、the data.You have to mine values from the data35分析工具组合分析工具组合已知的问题已知的问题已知的已知的数据来源数据来源未知的问题未知的问题未知的未知的数据来源数据来源数据探索数据探索数据挖掘数据挖掘商务智能商务智能我们现在的分析工具覆盖了所有可能的分析类型最常见的应用场景最常见的应用场景Most common use cases37最常见的应用场景最常见的应用场景 Most common use cases1)数据池-将所有数据存储在一个地方。存储各种格式的大量数据在同一个地方。几乎所有Oracle大数据客户都在为此使用HadoopData p

    47、ool store all data in single place.Store big data volumes,variety of the formats in the single place.Almost all Oracle Big Data customers are using Hadoop for this purposes38Garanti银行最常见的应用场景39数据池结构化数据Structure Data半结构化数据Semi Structured非结构化数据Unstructured信用卡行为客户财务客户行为信贷智能应用位置系统和应用日志渠道日志(ATM互联网,IVR,CC

    48、)点击流数据客户投诉社交媒体数据语音到文字最常见的应用场景最常见的应用场景 Most common use cases1)数据池-将所有数据存储在一个地方。存储各种格式的大量数据在同一个地方。几乎所有Oracle大数据客户都在为此使用HadoopData pool store all data in single place.Store big data volumes,variety of the formats in the single place.Almost all Oracle Big Data customers are using Hadoop for this purpose

    49、s2)数据池提供对广泛信息的访问。如果您的企业有很多客户,那么创建360视图配置文件以向他提供目标报价相当常见Data pool provides access to wide scope of the information.And If your business has a lot of customers,its quite common to create 360 view profile,for making target offers to him40AdNoc 360视图(360 view.AdNoc.)AdNoc是阿联酋的天然气公司AdNoc is Gas company i

    50、n UAE他们几乎在每个加油站都有小超市They have minimarket almost on the each Gas station根据客户的消费情况,他在采购期间实时获得相应的报价Based on the customers spending profile,he get corresponding offer in real-time during the purchasing大数据潜在应用场景大数据潜在应用场景2(目标客户促销)(目标客户促销)中国东方航空 360视图(360 view.China Eastern Airlines)这是业务场景实施的基础这是业务场景实施的基础S

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据项目实施.pptx
    链接地址:https://www.163wenku.com/p-4105192.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库