书签 分享 收藏 举报 版权申诉 / 46
上传文档赚钱

类型真正的大数据云计算平台方案.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4432796
  • 上传时间:2022-12-08
  • 格式:PPT
  • 页数:46
  • 大小:10.59MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《真正的大数据云计算平台方案.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    真正 数据 计算 平台 方案
    资源描述:

    1、第一部分1.1云计算平台架构clouDil1.2MapReduce+TaskMaster1.3DataCube1.4cCloud1.5cStor第二部分云计算平台能力真正的云计算平台,它有五层架构:真正的云计算平台,它有五层架构:l运维管理层:clouDill计算层:MapReduce+TaskMasterl数据管理层:DataCubel虚拟化层:cCloudl存储层:cStor第一部分1.1云计算平台架构1.2MapReduce+TaskMaster1.3DataCube1.4cCloud1.5cStor第二部分云计算平台能力clouDil在搭建云计算平台时,遇到了很多的问题和挑战。开始搭建

    2、时,第一次来了那么多性能在搭建云计算平台时,遇到了很多的问题和挑战。开始搭建时,第一次来了那么多性能强劲的机器,我们在感到兴奋的同时,也不免有些顾虑。强劲的机器,我们在感到兴奋的同时,也不免有些顾虑。l出了问题怎么办,有没有预警机制?l有没有可视化的管理界面?l机器宕机,管理员能否实时监控到?l如何做性能调优?l扩容升级时,能否给出依据?带着这些问题,我们开始了自己的云计算平台管理和运营之旅,现在完美的形成了一整带着这些问题,我们开始了自己的云计算平台管理和运营之旅,现在完美的形成了一整套云计算平台管理体系。套云计算平台管理体系。流量监控健康度报告节点性能监控集群状态监控集群状态监控第一部分1

    3、.1云计算平台架构1.2clouDil1.3DataCube1.4cCloud1.5cStor第二部分云计算平台能力MapReduce+TaskMasterMapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。TaskMaster是云创存储自主研发的一款高效云调度平台。它保证在云计算平台中部分硬件或软件发生故障的情况下仍不影响系统的正常运行;保证在云计算平台中高效稳定的合理化分配和执行任务,同时能够完美解决系统单点故障问题,负载均衡,自动调度与部署。l产品优势产品优势l高可靠性高可靠性:采用“多主多备,负载均衡”的管理节点,从而保证无论管理节点还是处理节点都不存在任何单点

    4、故障问题。l低依赖性低依赖性:采用模块化设计思想,通过统一化配置和API接口的方式向用户提供服务。l低干预性低干预性:采用基于事件化的统一管理模式。在系统无人值守的情况下自动完成故障处理等功能。l高实时性高实时性:在机器性能允许的范围内,所有任务的控制工作基本都在秒级完成,具有前所未有的高效性。第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4cCloud1.5cStor第二部分云计算平台能力DataCube数据立方是一种高效分布式的处理海量数据的云处理软件,具有从TB乃至PB级的数据中挖掘出有用的信息并进行快捷、高效处理的能力,同时支持数据仓

    5、库存储和商业智能分析等业务。该软件基于hadoop平台大数据处理的解决方案,具有处理能力高效、超高可靠性的优点。l产品特点产品特点l对任意多关键字实时索引l支持类SQL复杂并行组合查询l分布式万兆实时数据流秒级处理l系统无单点,确保意外情况下,系统的正常运行第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4DataCube1.5cStor第二部分云计算平台能力cCloudcCloud是南京云创存储科技有限公司自主研发的虚拟化云计算平台。cCloud平台可以加速高伸缩性的公共和私有云IaaS的部署、管理、配置。帮助企业用户快速而轻松地将虚拟数据中

    6、心资源转 入自动化、富于弹性且可自我服务的云平台中。另外cCloud兼容亚马逊API接口允许跨cCloud和亚马逊平台实现负载兼容。使用cCloud作为基础数据中心操作者可以快速方便的通过现存基础架构创建云服务。cCloud系统构架第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4DataCube1.5cCloud第二部分云计算平台能力cStorcStor云存储系统是南京云创存储自主研发的高科技产品。与传统的大规模存储系统相比,cStor针对绝大多数数据密集型应用的特点从多个方面进行了优化,从而在一定规模下达到成本、可靠性和性能的最佳平衡。目前

    7、,cStor云存储系统已成功应用于安防、广电、交通、电信、政务等诸多领域。l产品特性产品特性l优异性能优异性能:支持高并发、带宽饱和利用。cStor云存储系统将控制流和数据流分离,数据访问时多个存储服务器同时对外提供服务,实现高并发访问。l高度可靠高度可靠:采用多个数据块副本的方式实现冗余可靠,数据在不同的存储节点上具有多个块副本,任意节点发生故障,系统将自动复制数据块副本到新的存储节点上,数据不会丢失,实现数据完整可靠。l在线伸缩在线伸缩:可以在不停止服务的情况下,动态加入新的存储节点,无需任何操作,即可实现系统容量从TB级向PB级平滑扩展;也可以取下任意节点,系统自动缩小规模而不丢失数据,

    8、并自动将取下的节点上的数据备份到其他节点上,保证整个系统数据的冗余数。l超大规模超大规模:支持超大规模集群,理论容量为1024*1024*1024 PB。l简单通用:简单通用:支持POSIX接口规范,支持Windows/Linux/Mac OS X,可当成海量磁盘使用,无需修改应用。同时系统也对外提供专用的高速API访问接口。cStor超安存云存储系统是新一代基于编码技术的分布式文件存储系统,它在cStor云存储系统的基础上,融入RS编解码取代传统副本冗余的方式进行系统容错,编解码参数M+N可根据应用需求灵活配置。相对于传统的副本冗余容错方式而言,具有更高的磁盘利用率和更高的系统可靠性,如采用

    9、8+2的编解码容错方式,磁盘利用率可以达到80%,允许同时损坏2台存储服务器。l产品特性产品特性l高磁盘利用率高磁盘利用率:对于传统具有N份副本容错而言,其磁盘利用率只有1/N,而采用编解码方式,磁盘利用率为M/(N+M),如8+2,其磁盘利用率为80%。l高可靠性高可靠性:传统全副本的容错方式,通过牺牲磁盘的有效容量来提升系统的可靠性,如1:1副本容错,磁盘利用率为50%,只能损坏1台存储节点;而采用2+2的编解码方式,在磁盘利用率为50%的情况下,允许同时损坏2台存储节点。l高安全性高安全性:数据在编码的过程中,也起到数据加密的作用,必须通过对应的解密算法解码才能够获取到原始数据,提升了系

    10、统的安全性。l优异性能优异性能:所有的存储节点兼作编解码计算节点,有效的保证了客户端的写入性能,同时充分利用了整个系统中大量存储节点的计算资源。第一部分1.1云计算平台架构1.2clouDil1.3MapReduce+TaskMaster1.4DataCube1.5cCloud第二部分cStor云计算平台能力数据立方etl工具是一个用来将数据立方和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到数据立方中,也可以将数据立方的数据导进到关系型数据库中。一大亮点就是可以通过hadoop的mapreduce把数据从关系型数

    11、据库中导入数据到数据立方。数据立方数据立方数数据据库库OracleMysqlPostgreSQL数据立方数据立方ETL工具工具硬件配置序序号号设备名称设备名称数量数量CPUCPU内存内存硬盘硬盘网络网络1主控节点1双路四核,主频2GHz32GB2TB*8双千兆网卡绑定2处理节点10双路四核,主频2GHz32GB2TB*8双千兆网卡绑定3客户端1双路四核,主频2GHz32GB2TB*8双千兆网卡绑定*千兆48口交换机建表语句:create table E_MP_POWER_CURVE(ID BIGINT,DATA_TYPE INT,DATA_POINT_FLAG INT,DATA_WHOLE_F

    12、LAG STRING,P1 DOUBLE,P2 DOUBLE,P3 DOUBLE,P4 DOUBLE,P5 DOUBLE,P6 DOUBLE,P7 DOUBLE,P8 DOUBLE,P9 DOUBLE,P10 DOUBLE,P11 DOUBLE,P12 DOUBLE,P13 DOUBLE,P14 DOUBLE,P15 DOUBLE,P16 DOUBLE,P17 DOUBLE,P18 DOUBLE,P19 DOUBLE,P20 DOUBLE,P21 DOUBLE,P22 DOUBLE,P23 DOUBLE,P24 DOUBLE,P25 DOUBLE,P26 DOUBLE,P27 DOUBLE,P

    13、28 DOUBLE,P29 DOUBLE,P30 DOUBLE,P31 DOUBLE,P32 DOUBLE,P33 DOUBLE,P34 DOUBLE,P35 DOUBLE,P36 DOUBLE,P37 DOUBLE,P38 DOUBLE,P39 DOUBLE,P40 DOUBLE,P41 DOUBLE,P42 DOUBLE,P43 DOUBLE,P44 DOUBLE,P45 DOUBLE,P46 DOUBLE,P47 DOUBLE,P48 DOUBLE,P49 DOUBLE,P50 DOUBLE,P51 DOUBLE,P52 DOUBLE,P53 DOUBLE,P54 DOUBLE,P55

    14、DOUBLE,P56 DOUBLE,P57 DOUBLE,P58 DOUBLE,P59 DOUBLE,P60 DOUBLE,P61 DOUBLE,P62 DOUBLE,P63 DOUBLE,P64 DOUBLE,P65 DOUBLE,P66 DOUBLE,P67 DOUBLE,P68 DOUBLE,P69 DOUBLE,P70 DOUBLE,P71 DOUBLE,P72 DOUBLE,P73 DOUBLE,P74 DOUBLE,P75 DOUBLE,P76 DOUBLE,P77 DOUBLE,P78 DOUBLE,P79 DOUBLE,P80 DOUBLE,P81 DOUBLE,P82 DOU

    15、BLE,P83 DOUBLE,P84 DOUBLE,P85 DOUBLE,P86 DOUBLE,P87 DOUBLE,P88 DOUBLE,P89 DOUBLE,P90 DOUBLE,P91 DOUBLE,P92 DOUBLE,P93 DOUBLE,P94 DOUBLE,P95 DOUBLE,P96 DOUBLE)PARTITIONED BY(DATA_DATE STRING,IDRAGE BIGINT)ROW FORMAT DELIMITED FIELDS TERMINATED BY,STORED AS TEXTFILE;该表一共104个字段,平均一条记录300Byte以下是从数据立方导入到

    16、Oracle的测试统计以下是从Oracle导入到数据立方的测试统计10001000万万条条25002500万万条条50005000万万条条1 1亿条亿条2 2亿条亿条用时(秒)46.29111.60193.05374.53746.26速度(万条/秒)21.622.425.926.726.810001000万万条条25002500万万条条50005000万万条条1 1亿条亿条2 2亿条亿条用时(秒)26.6659.80113.37203.25395.26速度(万条/秒)37.541.844.149.250.6l基本过程基本过程l首先,加载数据集到内存l整个数据集上预处理:提高数据质量、选择属性、

    17、采样/过滤得到候选数据子集l在预处理后的候选数据子集上,执行数据挖掘算法,得到模型l利用模型,对新数据集给出预测结果l问题问题-海量数据海量数据l内存不足l难以接受的响应时间l数据挖掘处理的特征数据挖掘处理的特征l离线分析l数据集内各条记录间独立、无数据相关性l绝大多数操作,需要遍历整个数据集对每条记录运算l训练数据的规模影响挖掘所得模型的精准度l训练数据和待预测数据集的规模影响系统响应时间l云计算平台优势云计算平台优势l海量数据可以被分布式存储于PC集群l每行记录很容易被M/R函数做为基本单元读入、并处理数据集可以按记录行分割为块,存储到集群中节点上,无需考虑记录行间相关性l各数据块间并行接受同一处理操作,提升系统响应时间人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:真正的大数据云计算平台方案.ppt
    链接地址:https://www.163wenku.com/p-4432796.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库