方案架构与案例研讨课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《方案架构与案例研讨课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方案 架构 案例 研讨 课件
- 资源描述:
-
1、方案架构与案例研讨方案架构与案例研讨精诚集团提供 Big Data 解决方案的独立品牌在台北与北京设有研发与专业服务团队我们关注的不只是技术,更在意挖掘 Big Data 对企业的商业价值透过软硬件一体的整合,大幅简化与优化企业处理 Big Data 的种种问题意图与关联充满的 Big Data 世界Etu 帮您具体整合来呈现大数据(Big Data)时代来临Structured Database Spreadsheet File in record formatSemi-structured XML Docs Logs Click-stream Equipment/Device,RFID t
2、agUnstructured Web Pages E-mail Multimedia Instant Messages DocumentsBig Data Big Data PeopleDevicesSensors移动互联网Mobile Internet物联网Internet of Things4新量级、新处理模式、新企业智能Big Data 要解决的问题要解决的问题 VolumeVolume海量的数据规模海量的数据规模Variety多样的数据类型多样的数据类型StreamsReal timeNear timeBatchTBPBEBStructuredUnstructuredSemi-stru
3、cturedAll the aboveValueVelocity快速的数据流转快速的数据流转巨大的数据价巨大的数据价值值6Social MediaMachine/SensorDOC/MediaWeb ClickstreamAppsCall LogLog什么是半结构化什么是半结构化/非结构化数据非结构化数据Big Data 带来的挑战带来的挑战不同不同“看看”数据的方式数据的方式需要更高性价比的数据计算与储存方式需要更高性价比的数据计算与储存方式不同的数据管理策略不同的数据管理策略超越企业现有超越企业现有 IT IT 的数据解决能量的数据解决能量不同“看”数据的方式8可视:结构化资料 15%未视
4、:半/非结构化数据 85%DB/DW主管们看的战情数位仪表板,其实是残缺的10万 GB10万 TB需要更高性价比的数据计算与储存方式9数据库数据仓库计算更快 存储更省85%半/非结构化的Log/Web page/Email/PDF/Image/Full-text/MS-Office file 不同的数据管理策略当我们想要扩充时,才发觉:架构只能 scale-up,scale-out 不易 处理时间过长,time-to-value 受限 成本过高,cost-efficiency 受限15%结构化的 DB/DW遗憾残缺每天几百 GB、几 TB 的资料,且持续成长中储存Storing 在收数据的同时
5、做必要的前置处理(pre-processing),并区分数据处理的优先等级(prioritizing)计算Processing如何有效的避免因硬件毁坏所导致的资料损毁管理Managing如何从中挖掘出所关注事件的 pattern 或 behavior分析Analyzing超越企业现有 IT IT 的数据解决能量11大数据的储存与处理大数据的储存与处理/运算运算大数据储存大数据储存大数据处理大数据处理数据分享数据分享数据检索数据检索数据分析数据分析数据展现数据展现分布式软件架构并行计算框架分布式存储横向扩容(Scale-out)架构什么是大数据处理什么是大数据处理(Big Data Proces
6、sing)abc/category.screen?category_id=PLANTS&JSESSIONID=S1FF9ADFF2amazon/gp/product/B005OCFGTO/ref=s9_simh_gw_p14_d0_g74_i5?pf_rd_m=ATVPDKIKX0DER&pf_rd_s=center-2&pf_rd_r=1YN4ES7ZEV17ZRKA858X&pf_rd_t=101&pf_rd_p=4631&pf_rd_i=507846books.tw/exep/prod/china/chinafile.php?item=CN10816425books.tw/exep/pr
7、od/china/chinafile.php?item=CN10759096news.yahoo/feds-issue-warning-unconven-sperm-donor-140811851.htmlLog file:1.5TB/dayLog file:1.5TB/dayHit CountWord Count 什么是大数据处理什么是大数据处理(Big Data Processing)abc/category.screen?category_id=PLANTS&JSESSIONID=S1FF9ADFF2amazon/gp/product/B005OCFGTO/ref=s9_simh_gw_
8、p14_d0_g74_i5?pf_rd_m=ATVPDKIKX0DER&pf_rd_s=center-2&pf_rd_r=1YN4ES7ZEV17ZRKA858X&pf_rd_t=101&pf_rd_p=4631&pf_rd_i=507846books.tw/exep/prod/china/chinafile.php?item=CN10816425books.tw/exep/prod/china/chinafile.php?item=CN10759096news.yahoo/feds-issue-warning-unconven-sperm-donor-140811851.htmlmystor
9、e.splunk/flower_store/cart.do?action=purchase&itemId=EST-13&JSESSIONID=SD7SL1FF9ADFFtech.qq/a/20191221/000094.htm24h.pchome.tw/?m=index&f=view&p=24hour&s=nlifeshopping.pchome.tw/?mod=store&func=style_show&SR_NO=DEAO45177.23.21.50-15/Nov/2019:00:07:45 GET/flower_store/product.screen?product_id=FL-10h
10、ttp:/mystore.splunk/flower_store/category.screen?category_id=PLANTS&JSESSIONID=SD7SL1FF9ADFF2 Mozilla/5.0(X11;U;Linux i686;en-US;rv:1.8.0.10)Gecko/20190223 CentOS/1.5.0.10-0.1.el4.centos Firefox/1.5.0.10 1604 1667233.77.49.54-15/Nov/2019:00:07:58 GET/flower_store/product.screen?product_id=K9-BD-01 H
11、TTP/1.1 mystore.splunk/flower_store/category.screen?category_id=FLOWERS&JSESSIONID=SD7SL1FF9ADFF2 Mozilla/5.0(X11;U;Linux i686;en-US;rv:1.8.0.10)Gecko/20190223 CentOS/1.5.0.10-0.1.el4.centos Firefox/1.5.0.10 1803 2431i10.32.1.37-15/Nov/2019:00:08:26 GET/flower_store/product.screen?product_id=FL-DSH-
12、01 HTTP/1 http:/mystore.splunk/flower_store/category.screen?category_id=FLOWERS&JSESSIONID=SD7SL1FF9ADFF2 Mozilla/5.0(X11;U;Linux i686;en-US;rv:1.8.0.10)Gecko/20190223 CentOS/1.5.0.10-0.1.el4.centos Firefox/1.5.0.10 1025 4463192.168.11.38-3 3rdrd party partypre-defined pre-defined ReportingReporting
13、FilterString Truncation Log file:1.5TB/dayLog file:1.5TB/day什么是大数据处理什么是大数据处理(Big Data Processing)Join1.1 TB per-day600 GB per-day什么是大数据处理什么是大数据处理(Big Data Processing)SequenceDe-Normalize177.23.21.50-15/Nov/2019:00:07:45 GET/flower_store/product.screen?product_id=FL-10http:/mystore.splunk/flower_stor
14、e/category.screen?category_id=PLANTS&JSESSIONID=SD7SL1FF9ADFF2 Mozilla/5.0(X11;U;Linux i686;en-US;rv:1.8.0.10)Gecko/20190223 CentOS/1.5.0.10-0.1.el4.centos Firefox/1.5.0.10 1604 1667233.77.49.54-15/Nov/2019:00:07:58 GET/flower_store/product.screen?product_id=K9-BD-01 HTTP/1.1 mystore.splunk/flower_s
15、tore/category.screen?category_id=FLOWERS&JSESSIONID=SD7SL1FF9ADFF2 Mozilla/5.0(X11;U;Linux i686;en-US;rv:1.8.0.10)Gecko/20190223 CentOS/1.5.0.10-0.1.el4.centos Firefox/1.5.0.10 1803 2431i10.32.1.37-15/Nov/2019:00:08:26 GET/flower_store/product.screen?product_id=FL-DSH-01 HTTP/1 http:/mystore.splunk/
展开阅读全文