理解大数据-实践大数据课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《理解大数据-实践大数据课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 理解 数据 实践 课件
- 资源描述:
-
1、理解大数据,实践大数据内容 对大数据的理解 拓尔思大数据产品布局和应用实践反对派认为,我们现在处在一个盲目的大数据崇拜时代大数据产生的背景 数据的爆发式增长和社会化趋势,新摩尔定律 大数据已经成为一种自然资源 机器数据日益重要 大数据不被利用就是成本大数据产生的背景 现有的商业软件难以处理大数据的规模和复杂性 获取(capture)存贮(storage)搜索(search)分享(sharing)分析(analysis)可视化(visualization)奥巴马大数据战略 2012年3月29日,白宫发布美国政府的大数据计划 通过提高从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学
2、与工程中的步伐,加强国家安全,并改变教学研究大数据的4V特性体量Volume多样性Variety价值密度Value速度Velocity非结构化数据的超大规模和增长总数据量的8090%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不明显不连贯的语法或句义大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效对大数据的理解1.大数据比云计算更为落地2.大数据不仅仅是“大”3.软件是大数据的引擎
3、4.大数据的应用不仅仅是精准营销5.管理大数据“易”,理解大数据“难”1、大数据比云计算更为落地商业模式驱动应用需求驱动云计算本身也是大数据的一种业务模式2、大数据不仅仅是“大”多大?PB 级比大更重要的是数据的复杂性,有时甚至大数据中的小数据如一条微博就具有颠覆性的价值3、软件是大数据的引擎 和数据中心(Data Center)一样,软件是大数据的驱动力,软件改变世界大数据生态:软件是引擎4、大数据的应用不仅仅是精准营销 通过用户行为分析实现精准营销是大数据的典型应用,但是大数据在各行各业特别是公共服务领域具有广阔的应用前景消费行业金融服务食品安全医疗卫生军事交通环保电子商务气象5、管理大数
4、据“易”理解大数据“难”虽然大数据是一个重大问题,真正的问题是让大数据更有意义 目前大数据管理多从架构和并行等方面考虑,解决高并发数据存取的性能要求及数据存储的横向扩展,但对非结构化数据的内容理解仍缺乏实质性的突破和进展,这是实现大数据资源化、知识化、普适化的核心 非结构化海量信息的智能化处理:自然语言理解、多媒体内容理解、机器学习等拓尔思大数据产品布局TRS机器数据挖掘引擎TRS SMAS 舆情云服务TRS 大数据管理系统V7.0TRS 大数据管理系统发展历程TRS 全文数据库TRS 非结构化数据库TRS 大数据管理系统TRS 大数据管理系统V7.0TRS 大数据管理系统V7.0 分布式并行
5、计算、多副本机制、没有单点的高可靠体系架构,兼容Hadoop标准 支持结构化、半结构化、非结构化数据的管理和搜索 支持实时及用户行为数据的高效管理和分析 支持PB级的海量数据管理 支持海量用户的高并发访问(千万级用户、万级并发)充分释放硬件的潜力(多核、大内存等)大规模部署的自动化和运行状态监控 创新的多检索引擎机制,提供开放的二次开发接口数据备份大数据管理系统 数据存储开发接口基于Hadoop的数据分析CKM文本挖掘与数据挖掘关联规则与序列模式挖掘推荐引擎的离线分析MapReduce数据库监控机器数据搜索引擎用户行为挖掘与推荐引擎基于时间分段的大数据检索与索引接口搜索引擎日志采集监控数据存储
6、层数据分析层日志发送节点Angent 1Angent 2Angent 3Angent n日志接收集群 Collector 1Collector 2Collector 3Collector nMaster管理集群Master 1Master 2Master n日志采集TRS 机器数据挖掘引擎机器数据挖掘引擎TRS 机器数据挖掘引擎特点 支持主流格式机器数据的实时采集、解析、管理和搜索。基于时间分段和负载均衡的大数据索引与检索机制。基于Web的机器数据搜索与分析界面。兼容Hadoop平台的日志挖掘和用户行为分析。基于多种推荐模型的在线推荐引擎 大规模部署的自动化和运行状态监控TRS SMAS功能框
7、架图舆情管理服务共享信息挖掘信息来源新闻论坛博客搜索引擎微博wiki自动排重、自动分类、自动摘要、自动分析舆情分类热点跟踪热点统计微博分析人物分析微博运营趋势分析整合统计关联图谱动态走势兴趣图谱未知探索热点变化意见领袖传播图谱关系分类个性展示敏感预警自由分布数图导出图表切换多维检索探针追踪元搜索外网外网微博论坛SNS网媒 官网官网提高销量用户满意度用户设计趋势分析竞争分析质量缺陷设计缺陷使用缺陷KOL维护声誉管理危机预警事件评估行为分析产品公关营销SMAS用户感知研发情绪感知及时服务口碑监测媒介监测S-CRM广义服务TRS SMAS 作用于企业2.0TRS 在大数据领域的应用实践 新华社多媒体
展开阅读全文