书签 分享 收藏 举报 版权申诉 / 35
上传文档赚钱

类型大数据构建新一代企业大数据平台精品课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3335653
  • 上传时间:2022-08-20
  • 格式:PPT
  • 页数:35
  • 大小:6.77MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据构建新一代企业大数据平台精品课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数据 构建 新一代 企业 平台 精品 课件
    资源描述:

    1、建立在建立在PAASPAAS平台上的新平台上的新一代一代数据平台数据平台解决方案解决方案Agenda 企业新一代数据平台的技术需求企业新一代数据平台的技术需求 创新的技术平台建设思路创新的技术平台建设思路面向大数据的分析面向大数据的分析Now What?So What?What?大数据分析大数据分析 企业内、外部的结构化和非结构化数据 数据量在TB级以上 以数据挖掘、预测和实时分析为主,强调对业务驱动传统传统BI 分分析析 企业内部的结构化数据,数据量在GBTB级 以报表、查询和分析为主,反应当前业务现状更丰富、更细致更丰富、更细致的客户管理的客户管理大数据分析在企业的应用大数据分析在企业的应

    2、用更准确、更及时更准确、更及时的营销管理的营销管理更高效、更全面更高效、更全面的风险管理的风险管理Customer 360o Single ViewKey Life Events&Next Best ActionStress Test&Credit Assessments通用银行业大数据分析平台通用银行业大数据分析平台管理分析类应用管理分析类应用数据交换平台数据交换平台应用集市应用集市数据区数据区核心系统总账系统国结系统网银系统系统企业内外部半结构化、非结构化数据数据数据产生层产生层数据数据交换层交换层数据传输数据稽核数据处理流程调度监控告警数据数据服务层服务层非结构化数据区非结构化数据区沙盘

    3、演练数据区沙盘演练数据区用户评价信息移动互联信息元数据数据数据应用层应用层历史归档数据区历史归档数据区 HDS客户主题协议主题产品主题事件沙盘演练应用沙盘演练应用实时分析应用实时分析应用数数据据管管控控层层POS增量财务增量库存增量采购增量增量临时数据区临时数据区实实时时数数据据区区核心数据总账数据国结数据数据主主题题数数据据区区社交媒体信息网银数据 客户管理财务管理风险管理管理客户管理财务管理风险管理管理运营管理用户访用户访问层问层决策人员管理人员数据科学家业务人员客户汇总账户汇总机构汇总产品汇总 企业大数据平台数据内容及实现技术企业大数据平台数据内容及实现技术Page 7 应用平台提交请求

    4、访问的数据,包括结构化和非结构化两类 在线存储周期超过数据生命周期规划的数据 适合适合Hadoop分布式架构管理分布式架构管理 无法用二维表结构来逻辑表达的无结构性的数据。例如文本、音频数据等。方便用数据库的二维表结构来逻辑表达实现的数据,数据结构字段含义确定,清晰。例如:客户信息、用电记录等。是挖掘数据价值的主要对象。支持分析型应用,时效性较低 支持前台交易系统查询需求,具有可靠性高、并发度大、采集频率短的特点按数据格式类别划分按数据格式类别划分按数据格式类别划分按数据格式类别划分按数据采集频度划分按数据采集频度划分大数据大数据 平台平台在线数据在线数据归档数据归档数据非结构化数据非结构化数

    5、据结构化数据结构化数据准实时数据准实时数据非实时数据非实时数据 面向贴源数据查询和主题数据整合。数据区,适合数据区,适合X86MPP数据库集群数据库集群范式化模型数据范式化模型数据 面向分析类应用。对应对应ADW和和CM数据区,适合数据区,适合MPP数据库集数据库集群群维度模型数据维度模型数据按数据模型划分按数据模型划分Page 8企业大数据平台架构原则企业大数据平台架构原则平台平台技术-跨平台数据交换批量和实时数据采用不同的技术手段和工具,遵循统一的文件接口标准技术-平台内数据复制跨同构/异构数据库(物理系统),基于文本、数据库的数据抽取和加载,数据的形式不发生变化,不涉及数据转换。数据复制

    6、后产生的数据副本主要是为了便于数据引用,需要制定数据副本的生命周期管理策略以及保证数据副本的只读属性。数据-数据即服务业务人员通过逻辑数据对象组件访问数据,而不用关心数据的物理存储方式。通过全行指标口径和维度、度量信息,使业务人员可以较容易、较快地定位和了解数据的内容。数据-数据质量控制通过一系列的技术和业务手段实现数据集成平台数据质量控制,主要体现在数据正确性(技术)、完整性、一致性(业务)、有效性。Page 9企业大数据平台架构原则企业大数据平台架构原则平平数据-历史数据分级存储和访问近线数据存储形式保持源表源结构,主要以数据库形式存储,支持在线数据查询、访问和应用支持,响应时间秒级。归档

    7、数据以廉价大容量磁盘方式存储,存储形式会根据数据环境和未来应用的差异,采用不同于源结构的存储形式。同时,归档数据需要创建“被动索引”并具备恢复到主题数据区或者汇总数据区的能力。数据-非结构化数据管理对于交易和处理过程中形态尚不稳定的非结构化数据,可由各平台根据时效性、一致性控制和完整性控制等要求考虑自行处理安全-数据访问安全对于普通的查询访问应用,应该具备屏蔽敏感信息的展现的能力。面向行内用户的数据访问,应按照数据的属主进行访问隔离。运维-系统日常运行性能管理在数据量不断增加、访问用户数量的增长、用户数据使用成熟度的变化、数据ETL持续滚动开发等场景的不断变化下,需要围绕日常性能管理,不断调整

    8、系统设计和运行策略。建设新一代数据平台的驱动力建设新一代数据平台的驱动力 完整的大规模数据的快速捕获流程完整的大规模数据的快速捕获流程 多种类型数据的存储多种类型数据的存储 数据的实时共享与交换数据的实时共享与交换 海量海量&剧增数据的支撑能力剧增数据的支撑能力 传统数据仓库技术和新技术的结合传统数据仓库技术和新技术的结合 Hadoop技术的合理运用与性能技术的合理运用与性能Agenda 企业新一代数据平台的技术需求企业新一代数据平台的技术需求 创新的技术平台建设思路创新的技术平台建设思路CONSUMER GRADE先行者先行者:服务于海量客户的互联网巨头企业服务于海量客户的互联网巨头企业MA

    9、INFRAMESoftware-Defined DatacenterNew Data-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-Defined DatacenterNew Data-fabrics私有的数据中心与基础架构CONSUMER GRADE先行者先行者:服务于海量客户的互联网巨头企业服务于海量客户的互联网巨头企业MAINFRAMESoftware-Defined DatacenterNew Data-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERV

    10、ER&WEBSoftware-Defined DatacenterNew Data-fabrics私有的数据中心与基础架构CONSUMER GRADE先行者先行者:服务于海量客户的互联网巨头企业服务于海量客户的互联网巨头企业MAINFRAMESoftware-Defined DatacenterNew Data-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-Defined DatacenterNew Data-fabrics私有的数据中心与基础架构CONSUMER GRADE先行者先行者:服务于海量客户的互联网

    11、巨头企业服务于海量客户的互联网巨头企业MAINFRAMESoftware-Defined DatacenterNew Data-fabrics新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流CLIENT-SERVER&WEBSoftware-Defined DatacenterNew Data-fabrics私有的数据中心与基础架构企业级的需求企业级的需求 MAINFRAMECLIENT-SERVER&WEBCONSUMER GRADE新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流大量设备大量设备,海量日志海量日志,多种应用多种应用无处不在的数据采集无处不在的

    12、数据采集Software-Defined DatacenterNew Data-fabrics来自金融企业的独有需求来自金融企业的独有需求 MAINFRAMECLIENT-SERVER&WEBCONSUMER GRADE新的客户体验新的业务模式由服务于海量客户的互联网巨头企业引领潮流大量设备大量设备,海量日志海量日志,多种应用多种应用无处不在的数据采集无处不在的数据采集Software-Defined DatacenterNew Data-fabrics来自金融企业的独有需求来自金融企业的独有需求 MAINFRAMECLIENT-SERVER&WEBCONSUMER GRADE新的客户体验新的

    13、业务模式由服务于海量客户的互联网巨头企业引领潮流大量设备大量设备,海量日志海量日志,多种应用多种应用无处不在的数据采集无处不在的数据采集Software-Defined DatacenterNew Data-fabrics.ETCNew ExperiencesNew Biz Modelspioneered by new Consumer Internet giantsInternet-of-thingsPervasive telemetryMAINFRAMECLIENT-SERVER&WEBCONSUMER GRADESoftware-Defined DatacenterNew Data-fa

    14、brics.ETC新一代新一代Paas平台建设思路平台建设思路Software-Defined DatacenterNew Data-fabricsThe Software Defined Data CenterNew ExperiencesNew Biz Modelspioneered by new Consumer Internet giantsInternet-of-thingsPervasive telemetryMAINFRAMECLIENT-SERVER&WEBCLOUD ERAAWSVMW.ETCPivotal:面向数据的企业级面向数据的企业级Paas平台平台FromVMware

    15、FromEMCBigDataFastDataRapid Application Dev&IntegrationCloud Abstraction&App AutomationSoftware-Defined DatacenterNew Data-fabricsThe Software Defined Data CenterNew ExperiencesNew Biz Modelspioneered by new Consumer Internet giantsInternet-of-thingsPervasive telemetryMAINFRAMECLIENT-SERVER&WEBCLOUD

    16、 ERAAWSVMW.ETCPivotal:面向数据的企业级面向数据的企业级Paas平台平台BigDataFastDataRapid Application Dev&IntegrationGemfirevFabricFromVMwareFromEMCCloud Abstraction&App Automation.ETC支持开放标准并与开源有效互动强调以数据为中心 兼顾各种数据类型处理充分关注新一代开发人员和新一代企业级应用的需求为有效进行实时大容量信息处理而设计同时兼顾与传统应用的互操作性与传统技术的有效结合云支撑平台数据支撑架构数据支撑架构应用支撑架构应用支撑架构Scale-out sto

    17、rage:HDFS/ObjectLanguages&FrameworksIngest&Query:very high-capacity&in-memoryAnalyticsServicesCloud Abstraction(portability)Automation:App Provisioning&Life-cycleService RegistryPivotal One:重新定义企业级重新定义企业级 PaaSCloud FabricData FabricApplication FabricScale-out storage:HDFS/ObjectLanguages&FrameworksI

    18、ngest&Query:very high-capacity&in-memoryAnalyticsServicesCloud Abstraction(portability)Automation:App Provisioning&Life-cycleService RegistryPivotal One:来自来自EMC和和VMW的技术体系整合的技术体系整合GemFirePivotal Data Science Labs创新:以数据支撑为中心创新:以数据支撑为中心Cloud StorageVirtualizationPivotal DataFabricPivotal Cloud&App Fabr

    19、icData-DrivenApplicationDevelopmentPivotal Data Science Labs.ETC完整的新一代企业的数据平台蓝图完整的新一代企业的数据平台蓝图AnalyticData MartsMPP DatabaseOperationalIntelligenceIn-Memory DBRun-TimeApplicationsIn-Memory ObjectEnterprise Data WarehouseRDBMSData StagingPlatformData IngestionSystemStreams分析形数据集市分析形数据集市实时的数据处理实时的数据处理

    20、Run-TimeApplications企业级数据仓库企业级数据仓库大规模数据存储大规模数据存储实时的数据实时的数据捕获和共享捕获和共享Pivotal 数据支撑架构的解决之道数据支撑架构的解决之道Greenplum 数据库:极速分析平台数据库:极速分析平台并行处理架构并行处理架构MPP shared-nothing 架构,基于通用X86平台PB级以上海量存储,最大支持10000节点以上所有节点并发IO,实现超大IO吞吐,并行运行SQL自动化并行自动化并行自动化并行计算,实现超大计算能力使用同传统DB一样,加载和运行SQL数据多节点分布及高可用性都由DB自身实现极佳的横向扩展性极佳的横向扩展性在

    21、线横向扩展容量、加载和SQL查询性能随节点线性增加专为专为BI及数据分析优化及数据分析优化深度整合统计数学模块(SAS,SOLR,MADLIB,R)高性能并行SQL执行器MPP shared-nothing 架构构建在X86开放平台上的并行处理架构Greenplum 数据库:行业最快的数据加载技术数据库:行业最快的数据加载技术SINGLE RACK COMPARISON 每个Rack(16节点),每小时16TB加载性能 Scatter-Gather Streaming提供性能线性扩张 支持大批量数据加载和持续化的数据加载 Enable complex data transformations“

    22、in-flight”对GBK/UTF8/ISO8859字符集的原生支持Greenplum load rates scale linearly with the number of racks,others do not.For example,two racks=32TB/HGreenplumOracleExadataNetezzaTeradataLoadGreenplum 数据库:高可用性数据库:高可用性ClientRedundantInterconnectMPSegment ServersPrimaryMaster1 Sync&FailoverProcesses Standby Maste

    23、rPrimaryDataRAID 5 ProtectionA1B1C1A2B2C2A1B1C1A2B2C2MirrorData2345 提供了全量备份和增量备份功能,保证系统级故障后的数据恢复 对于任一设备的故障,系统数据不丢失、提供持续服务 多个节点宕机后,系统性能只降低1/6Greenplum 数据库:数据库:Gartner 的评价的评价 Gartner 公司每年发布关于数据仓库管理系统业界地位的魔法象限研究报告 报告主要从个数据仓库厂商的执行力和远景两个方面评估 评估对象包括传统的企业级数据仓库和新一代的MPP并行数据库厂商支持各种规模、有大量并发用户、能管理混合工作负载的数据仓库具备较

    24、高的客户满意度和强有力的服务支持在数据仓库市场有长久的生命力风险最低、产品成熟度最高Gartner对领导者象限的评价对领导者象限的评价采用前瞻性思维设计的数据仓库较小的市场领导者,缺乏全球性发展缺少较大的本地客户,因此不易证明其产品的功能和价值在产品技术领域,某些特性具备前瞻性,但综合能力需要完善Gartner对远见者象限的评价对远见者象限的评价Load BalancerWeb and App ServersWebMiddwareDatabase LayOSAppOSAppWhat is GemFireOSAppOSAppOSAppOSAppOSAppOSAppMemory Compute D

    25、ata Grid in Memory Pivotal Hadoop HAWQ:性能测试结果对比性能测试结果对比4.21988.71612.04152.71,2852.81,81547X19X208X476X648X4.2378.75962.0502.7552.8599X69X25X20X21XPivotal HDPivotal HDPivotal Cloud and Application FabricCloud StorageVirtualizationPivotal DataFabricPivotal Cloud&App FabricData-DrivenApplicationDevelo

    26、pmentPivotal Data Science Labs.ETCPIVOTAL TECHNOLOGY MISSION A complete software-centric application+data platform.Driven by a strong open-source foundation Hadoop-centric data infrastructure&services(spanning storage,real-time operational,&analytic)Integrated PaaS supporting applications developed

    27、in multiple languages&frameworks Open model that enables the integration of self-service utilities to be plugged in and deployed within existing legacy environments Analytics&visualization instrumented by default Cloud enabled,whether deployed in the datacenter or the public cloudSummary新的技术创造新的业务价值新的技术创造新的业务价值2大数据驱动业务转型大数据驱动业务转型1EMC/Pivotal 助力金融企业打造助力金融企业打造完整的新一代数据管理平台完整的新一代数据管理平台3

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据构建新一代企业大数据平台精品课件.ppt
    链接地址:https://www.163wenku.com/p-3335653.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库