超大规模深度学习在美团的应用课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《超大规模深度学习在美团的应用课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 超大规模 深度 学习 应用 课件
- 资源描述:
-
1、超大规模深度学习在美团的应用余建平美团点评用户平台研究员自我介绍2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习工程相关的工作,加入美团后,负责超大规模机器学习系统,从无到有搭建起支持千亿级别规模的深度学习系统,与推荐、搜索、广告业务深度合作,在算法上提供从召回到排序的全系统优化方案,在工程上提供离线、近线、在线的全流程解决方案。目录 美团超大规模模型场景简介 超大规模机器学习MLX MLX平台目标 MLX平台架构 模型场景应用 召回模型 排序模型目录 美团超大规模模型场景简介 超大规模机器学习MLX MLX平台目标 MLX平台架构 模型场景应用 召回模型 排序模
2、型美团超大规模模型应用场景美团推荐美团搜索美团应用场景简介 场景特点 模型特点亿级的用户,千万级的O2O商品海量的用户行为,完整的交易闭环LBS相关的推荐百亿级别的训练数据千亿级别的模型特征秒级实时的模型反馈目录 美团超大规模模型场景简介 超大规模机器学习MLX MLX平台目标 MLX平台架构 模型场景应用 召回模型 排序模型超大规模模型的有效性 VC维理论 描述模型的学习能力:VC维越大模型越复杂,学习能力越强 机器学习能力=数据+特征+模型 数据 海量数据:美团的亿级用户、千万级POI 特征 大规模离散特征 小规模泛化特征 模型 DNN 树模型 LR美团超大规模模型应用场景 可扩展的机器学
3、习架构 基于Parameter Server架构 数据并行 支持超大规模训练集 模型并行 支持超大规模模型 业界千亿级以上的机器学习平台 开源:PaddlePaddle、XDL,etc.内部:Abacus、XPS,etc.关于Online Learning Online Learning的价值 用户的近期行为,更能表现意图和偏好 增强新item的模型感知能力 更快数据反馈、更少资源消耗 分钟级的数据反馈 增量训练、避免batch重训带来的资源消耗MLX的模型能力 支持千亿级特征、千亿级样本 支持计算图模式,模型结构灵活多样 支持推荐、搜索、广告场景常用的深度学习模型 FTRL、FM、FFM、W
4、DL、DCN、DeepFM、MTL等MLX的模型能力 Optimizer FTRL、AdaGrad、AdaDelta、ADAM、AmsGrad、etc Loss Function LogLoss、SquareLoss、Cross Entropy、etc 评估指标 AUC、Loss、MAE、RMSE 支持外部eval工具,计算MAP、NDCGMLX模型能力 提供离线、近线、在线全流程解决方案,各阶段提供扩展方案,降低算法迭代成本;支持Online Learning,提供从近线到在线的模型数据通路;提供从召回到排序全流程的模型解决方案,为业务提供最佳实践;提供系统的平台化工具,为用户提供易用的界面
5、操作;MLX平台架构MLX平台架构模型训练框架 基于Worker+PS架构搭建 Worker 模型计算引擎(Engine)计算图框架(Graph)模型计算引擎Engine 模型结构处理 与PS通信交换模型参数 计算图的计算 计算图框架Graph 计算逻辑抽象op,通过op组合形成模型结构 提供正向(forward)、反向(backward)、Loss的操作扩展模型训练框架 模型可变计算路径 应用场景离线预计算 运行阶段 模型召回,ANN检索 计算图裁剪 粗排模型,降低线上计算量Parameter Server 分布式Sharding 模型分片存储,支持超大规模模型 数据并行计算,加速Optim
展开阅读全文