书签 分享 收藏 举报 版权申诉 / 45
上传文档赚钱

类型链家网大数据平台体系构建历程课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:2890595
  • 上传时间:2022-06-08
  • 格式:PPTX
  • 页数:45
  • 大小:2.43MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《链家网大数据平台体系构建历程课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    网大 数据 平台 体系 构建 历程 课件
    资源描述:

    1、链家网大数据平台体系构建历程技术创新 变革未来目录一、背景简介二、大数据从0到1的架构落地三、大数据平台化体系的建设四、总结一家卖房的中介公司要什么大数据?业务背景 12001年链家地产第一家门店22014年链家网 成立全面推进O2O打通线上线下服务32015年组建大数据部链家网数据知多少经纪人13万用户2000万线上日UV 千万线下日约看房4万次全国楼盘字典 7000万链家网大数据应用场景房屋估价链家网大数据应用场景房客图谱链家网大数据应用场景BI报表目录一、背景简介二、大数据从0到1的架构落地三、大数据平台化体系的建设四、总结大数据早期落地架构图 搭建Hadoop集群 构建Hive数据仓库

    2、 定制化报表开发大数据早期落地架构图特点 简单 开源HIVE数据仓库模型DWSTGODSDWOLAPRPT星型模型 雪花模型大数据从0到1落地成果挖掘分析支撑报表整合数据目录一、背景简介二、大数据从0到1的架构落地三、大数据平台化体系的建设四、总结业务发展带来的新挑战数据需求快速增长数据治理亟需规范数据安全迫在眉睫大数据平台化体系演进新大数据平台化架构工具服务层数据权限调度执行数据质量应用层基础层业务用户画像运营管理搜索推荐房客图谱数据接入KafkaMysql数据存储HiveHDFSHBase数据计算MRStormSparkKylin数据API元数据自助报表数据挖掘PAAS新大数据平台化架构数

    3、据需求快速增长数据治理亟需规范数据安全迫在眉睫 自助报表 调度系统 元数据系统 指标平台 数据权限 Ad hoc大数据平台化实践010203应用层工具层基础层点此输入标题点此输入文字大数据平台化实践01应用层点此输入标题点此输入文字BI报表产出慢数据指标无统一定义数据流转脚本多应用层地动仪自助报表点此输入标题点此输入文字 通用报表5分钟配置 支持Mysql / Kylin/ Presto等多数据源 Dashboard可复用组合应用层地动仪自助报表点此输入标题点此输入文字应用层元数据管理和指标平台点此输入标题应用层元数据管理和指标平台点此输入标题点此输入文字 表的增删改查 指标的描述应用层元数据

    4、管理和指标平台点此输入标题点此输入文字 完善的元数据管理 核心指标统一定义 数据流转集中管控大数据平台化实践010203应用层工具层基础层点此输入标题点此输入文字大数据平台化实践02工具层点此输入标题点此输入文字ETL作业调度运维难Ad hoc 查询速度慢任务链路 不清晰工具层任务调度系统点此输入标题点此输入文字 数据链路长 任务种类多 依赖类型杂工具层任务调度系统点此输入文字工具层任务调度系统点此输入标题点此输入文字工具层任务调度系统点此输入文字 简单易用的依赖配置 提供ETL常用组件,零编码 一键修复追溯,图形化运维 智能调度,错峰运行工具层Ad hoc点此输入标题点此输入文字050100

    5、150200250PrestoSparkSQLHIVESQL速度测试对比10G100G Hive Presto Spark SQL Impala Kylin Druid 广 快工具层Ad hoc点此输入标题点此输入文字 快速查询 语法兼容 容灾HA SQL QueryAdhocPresto DownloadAdapter Spark SQLHIVE仓库Redis/File查询双引擎大数据平台化实践010203应用层工具层基础层点此输入标题点此输入文字大数据平台化实践0基础层点此输入标题点此输入文字集群任务剧增集群数据安全集群资源隔离基础层集群安全和存储点此输入文字 数据权限自上而下打通 用户操

    6、作审计日志 用户队列资源隔离机器数100任务数10000数据量1.8PB日增量5 TB基础层集群性能优化点此输入文字 资源预留,保障核心作业 参数调优 冷数据迁移S3存储VM.overcommit_memoryMpress.map.outputetc/fstab data noatime,nodiratime 大数据平台化取得的效果点此输入文字 数据获取效率大大提升,从1-2周提升到1-2天 分析师能多维度快速探索数据,分钟级到秒级 公司核心指标统一管理 数据全生命周期追踪展望点此输入文字 数据血缘 数据预警 混合云 机器学习平台化支撑目录一、背景简介二、大数据从0到1的架构落地三、大数据平台化体系的建设四、总结案例启示传统企业 / 初创团队 如何快速落地大数据 采用成熟的业界方案 深入业务找到契合点案例启示业务迅速增长,平台化思维是一个法宝 自助服务 Eat Your Own Dogfood案例启示平台化的产品需要梳理流程,制定规范 数据流集中管控 核心指标委员会总结链家网为啥要做大数据从0到1快速落地的架构大数据平台体系的三层 谢谢聆听!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:链家网大数据平台体系构建历程课件.pptx
    链接地址:https://www.163wenku.com/p-2890595.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库