海量数据搬运工-DataStream课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《海量数据搬运工-DataStream课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 海量 数据 搬运工 DataStream 课件
- 资源描述:
-
1、海量数据搬运工 Datastream大纲Datastream 产生的原因Datastream 的结构和特征Datastream 关键技术点分享Datastream 应用场景Datastream 未来展望场景 1 BI,xx 应用想做下日志的统计分析,收集一下吧场景 2 线上的服务器日志做下分析吧,可能有DDOS场景 3 要拿数据库增量数据,建索引、反攻击、做分析,写点程序吧怎么办呢 问题:每个产品数据都不相同,不同部门代码复用率低 后果:BI、反垃圾、搜索引擎的同学都要疯了 解决方案:我们搞个统一的收集数据的平台吧Datastream 应运而生 我们不生产数据,我们是数据的搬运 工大纲Data
2、stream 产生的原因Datastream 的结构和特征Datastream 关键技术点分享Datastream 应用场景Datastream 未来展望什么是 Datastream Datastream 是一个数据传输平台,用于连通数据源和终端用户的桥梁他最大的作用就是:让终端用户对数据获取方式透明 让终端用户对数据的格式透明系统框架特性特性说明说明搬运节点线性扩展集群中节点可动态增减,个别节点宕机不影响集群数据来源多样化可支持多种数据源,新数据源支持简单数据存储终端多样化可根据产品需要支持不同类型的数据存储终端数据分流和复制根据产品需要对数据进行分流和复制输出数据格式统一统一采用结构化JS
3、ON的数据输出格式,产品端提取数据简单强大的管理平台管理平台有各种强大的向导功能远程控制所有的Datastream客户端都通过管理平台统一做远程控制,无需登录服务器系统特征大纲Datastream 产生的原因Datastream 的结构和特征Datastream 关键技术点分享Datastream 应用场景Datastream 未来展望关键技术点一、异构数据源解析二、数据分流三、数据可靠传输四、数据传输效率一、异构数据源解析 Datastream 从扩展性上来看能支持各种各样的数据源,目前支持一下数据源:文本文件 Syslog 日志 Mysql binlog文本日志来源 主要是应用服务器的日志
4、文件通过一个轻量级的 agent 来 tail 服务器本地日志并发送到 datastream文本日志解析的特点 支持各种滚动方式的日志 支持断点续传 轻量级,占用系统资源少 对应用无侵入 支持多行相关联日志输出为一行(例如 java 异常,结构化的 JSON,xml 等)tailFile 多行解析的实例Syslog 日志来源 这是一个通用的日志协议,不受编程语言限制,来源有 服务器系统日志 应用的重要日志 Apache,nginx 等代理日志Syslog 日志Syslog 日志解析特征 平台无关 应用侵入性低Mysql binlog 来源 Mysql binlog 是 mysql 增量数据的记
展开阅读全文