从日志统计到大数据分析.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《从日志统计到大数据分析.pptx》由用户(无敌的果实)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 日志 统计 数据 分析
- 资源描述:
-
1、从日志统计到大数据分析 2008:日志统计平台 2011:用户数据仓库 2013:数据源管理 需求响应周期长 运维成本高 运行速度慢 员工个人成长受限基于 Hadoop 的日志统计平台ndaysnminsnnminshours运行时间:开发周期:天级 到 分钟级经过1年半的时间,整个公司的统计任务都统一到了平台小时级 到 分钟级 计算资源需求急剧膨胀 数据质量没有保证 数据价值没有充分利用统一的用户数据仓库InsightDataMartUser Data Warehouse结构化数据文本日志网页搜索网页搜索凤巢网盟网盟知道百科百科凤巢知道全公司所有业务线的用户行为数据统一到一张表,通过用户 I
2、D可以访问到用户在全百度上的所有行为用户IDID01ID02ID03事件类型注册时间国家省份URL登陆搜索数据源混乱 入库周期长 数据时效性低直接从数据源头治理非结构日志源 格式变更影响下游 数据解析效率低 数据内容不可理解结构化日志源(Google Protocol Buffer):格式变更向前向后兼容 数据解析效率高 数据带有Schema 节省存储和带宽日志源的结构化、传输实时化 查询引擎直接可分元数据审核管理 析源结构化数据 数据源统一管理,覆盖数万台服务器 数据源头产生,既可实时 SQL 分析 数据源很重要 Event 模型很有效 数据采集手段在增强 大数据计算能力的软硬件环境在成熟
3、竞争加剧,整个行业的数据意识在提升 人力成本 时间成本 数据采集能力不足 分析能力比较基础 数据资产顾虑神策分析可以私有化部署的用户行为分析产品私有化部署 全端数据接入 PaaS 平台全端数据接入代码埋点可视化埋点导入辅助工具PaaS 平台BI数据存储层数据传输层数据接入层BI数据存储层数据传输层数据接入层架构实现 适应私有化部署 数据与处理能力完全开放 模型精简,减少 ETL 开销 支持每天十亿级别数据 秒级导入,秒级查询数据流向利用神策的查询开放接口,可以非常容易的:与客户已有的系统进行无缝对接 利用 SQL 引擎扩展已有的分析功能 为合作方提供强大的在线分析能力在线分析搜索优化个性化推荐精准广告用户画像100%文本挖掘反作弊金融电商视频企业服务 在线教育么么直播在线医疗 新媒体健身游戏 互联网 其他神策分析,帮你实现数据驱动!
展开阅读全文