HDS统一计算平台的大数据解决方案.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《HDS统一计算平台的大数据解决方案.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HDS 统一 计算 平台 数据 解决方案
- 资源描述:
-
1、 Hitachi Data Systems Corporation 2014.All rights reserved.1 Hitachi Data Systems Corporation 2014.All rights reserved.1HDS 统一计算平台的统一计算平台的大数据解决方案大数据解决方案HDS channel enablement TeamCicean Wang Hitachi Data Systems Corporation 2014.All rights reserved.2议程 Hitachi Data Systems Corporation 2014.All right
2、s reserved.33它真正的含义是什么?Hitachi Data Systems Corporation 2014.All rights reserved.4大数据及大数据时代“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产力增长和消费者盈余浪潮的到来”麦肯锡您将会面对的是16.416.4ExabytesIn 20103535ZxabytesIn 2020IDC做出估算30倍 Hitachi Data Systems Corporation 2014.All rights reserved.5大数据的定义(4V)海量(Vo
3、lume)多样(Variety)快速(Velocity)价值(Value)3亿用户,每天上亿条微博中型城市每月数十亿智能电表数据2015年全球移动终端产生的数据量6300PB卫星图像个人信息M2M 日志文件传感图像视频音频非结构化数据将占到75%-85%增长速度快用户基数庞大设备数量众多实时海量数据数据指数级别增长单条数据并无太多价值,但庞大的数据量蕴含巨大财富 Hitachi Data Systems Corporation 2014.All rights reserved.6存储理解控制大数据最终的目的大数据可以从根本上提高洞察力获得洞察力!跨越鸿沟输入数据$Hitachi Data Sy
4、stems Corporation 2014.All rights reserved.7大数据-第三次浪潮的华彩乐章2012年3 月份美国奥巴马政府发布了大数据研究和发展倡议(Big Data Research and Development Initiative),投资2 亿以上美元,正式启动“大数据发展计划”。计划在科学研究、环境、生物医学等领域利用大数据技术进行突破。奥巴马政府的这一计划被视为美国政府继信息高速公路(Information Highway)计划之后在信息科学领域的又一重大举措。与2013年12月 贯彻落实广东省信息化发展规划纲要(2013-2020年),加快物联网、云计算
5、、大数据等新一代信息技术创新应用,推进我省智慧城市建设,打造珠三角世界级智慧城市群,全面提升全省信息化发展水平。广东省委副书记朱小丹广东省经济和信息化委员会副主任,党组副书记邹生 Hitachi Data Systems Corporation 2014.All rights reserved.8我们为什么需要大数据 在没有大数据技术之前,无论是机器,还是人工方式,无法获得全量样本。以人口普查为例,如果挨家挨户调研,甚至随机抽取做调研,都非常耗时,费力,很多国家甚至做不到每年发布一次 在没有大数据技术之前,大量海量数据中非结构化数据,分析与计算,几乎是一个不可能逾越的鸿沟,更别说挖掘价值了。在
6、没有大数据技术之前,分析数据仅作为参考目前现状的理论依据,也就是经验说话,数据无法实时展现价值。在没有大数据技术之前,有原因所以有结果,维度由于分析能力有限,无法表现其真正意义,相关而非因果。Hitachi Data Systems Corporation 2014.All rights reserved.99将大数据承诺转化为巨大的价值 Hitachi Data Systems Corporation 2014.All rights reserved.1010从“谷歌流感趋势”工具看大数据应用跟踪搜索词相关数据来判断全美地区的流感情况这个工具工作的原理大致是这样的:设计人员置入了一些关键词(
7、比如温度计、流感症状、肌肉疼痛、胸闷等),只要用户输入这些关键词,系统就会展开跟踪分析,创建地区流感图表和流感地图。谷歌多次把测试结果(蓝线)与美国疾病控制和预防中心的报告(黄线)做比对,从图可知,两者结论存在很大相关性。Hitachi Data Systems Corporation 2014.All rights reserved.11以银行信贷审批决策为例 Hitachi Data Systems Corporation 2014.All rights reserved.12用户移动轨迹和精准用户群集分析应用 Hitachi Data Systems Corporation 2014.A
8、ll rights reserved.13实时精准营销-只给最近的你 Hitachi Data Systems Corporation 2014.All rights reserved.1414支撑大数据应用的IT架构实例 Hitachi Data Systems Corporation 2014.All rights reserved.15 新的大数据技术传统数据库处理方式 池塘捕鱼新的大数据处理方式 大海捕鱼数据规模数据类型模式和数据关系处理对象处理工具 Hitachi Data Systems Corporation 2014.All rights reserved.16数据的自由度和性
9、能矛盾。数据的自由度和性能矛盾。固定字段、维度的表结构,限制固定字段、维度的表结构,限制了数据的入库和拓展。了数据的入库和拓展。数据处理数据处理数据库数据库中间件中间件索引及应用开发索引及应用开发J2EEStorageFilesytem/LUNDatabaseJ2EEJ2EEWebWebWebWebWeb数据索引方式的瓶颈,依赖文件目录结构(数据索引方式的瓶颈,依赖文件目录结构(NASNAS)或私)或私有的位图块表结构(有的位图块表结构(BlockBlock)。)。非结构数据还需要上层数据库或文件系统提供索引;非结构数据还需要上层数据库或文件系统提供索引;面对大数据传统IT的架构的瓶颈存储成本
10、(TB)20,000 rmb数据库和中间件(TB)15,000 rmb计算(TB)30,000 rmb技术服务(TB)10,000 rmb应用服务 依赖合作伙伴总体拥有成本(TB)75,000 rmb Hitachi Data Systems Corporation 2014.All rights reserved.17后期维护后期维护成本成本低下的低下的数据管理性能数据管理性能存储扩容成本存储扩容成本面对大数据传统IT的架构带来的问题 Hitachi Data Systems Corporation 2014.All rights reserved.18新的大数据处理技术-Hadoop核心思
11、想:分布式+经济Hadoop:分布式,大数据集,延时,离线计算 NoSQL:分布式,小数据集,灵活,实时,快速读写 Hitachi Data Systems Corporation 2014.All rights reserved.19天云&HDS大数据混合计算一体机J2EEWebHDS CR 220SHadoop DistributionsStreamingSearchingIndexMemDBBDP(BeagleData Platform)Integration/Autumation/Monitoring/Scheduling/MaintainanceData Mgnt:DataView
展开阅读全文