超大规模深度学习在美团的应用课件.pptx

上传人（卖家）：三亚风情

文档编号：3389779

上传时间：2022-08-26

格式：PPTX

页数：38

大小：8.33MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

25 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《超大规模深度学习在美团的应用课件.pptx》由用户（三亚风情）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 超大规模深度学习应用课件

资源描述：: 1、超大规模深度学习在美团的应用余建平美团点评用户平台研究员自我介绍2011年硕士毕业于南京大学计算机科学与技术系。毕业后曾在百度凤巢从事机器学习工程相关的工作，加入美团后，负责超大规模机器学习系统，从无到有搭建起支持千亿级别规模的深度学习系统，与推荐、搜索、广告业务深度合作，在算法上提供从召回到排序的全系统优化方案，在工程上提供离线、近线、在线的全流程解决方案。目录美团超大规模模型场景简介超大规模机器学习MLX MLX平台目标 MLX平台架构模型场景应用召回模型排序模型目录美团超大规模模型场景简介超大规模机器学习MLX MLX平台目标 MLX平台架构模型场景应用召回模型排序模
2、型美团超大规模模型应用场景美团推荐美团搜索美团应用场景简介场景特点模型特点亿级的用户，千万级的O2O商品海量的用户行为，完整的交易闭环LBS相关的推荐百亿级别的训练数据千亿级别的模型特征秒级实时的模型反馈目录美团超大规模模型场景简介超大规模机器学习MLX MLX平台目标 MLX平台架构模型场景应用召回模型排序模型超大规模模型的有效性 VC维理论描述模型的学习能力：VC维越大模型越复杂，学习能力越强机器学习能力=数据+特征+模型数据海量数据：美团的亿级用户、千万级POI 特征大规模离散特征小规模泛化特征模型 DNN 树模型 LR美团超大规模模型应用场景可扩展的机器学
3、习架构基于Parameter Server架构数据并行支持超大规模训练集模型并行支持超大规模模型业界千亿级以上的机器学习平台开源：PaddlePaddle、XDL，etc.内部：Abacus、XPS，etc.关于Online Learning Online Learning的价值用户的近期行为，更能表现意图和偏好增强新item的模型感知能力更快数据反馈、更少资源消耗分钟级的数据反馈增量训练、避免batch重训带来的资源消耗MLX的模型能力支持千亿级特征、千亿级样本支持计算图模式，模型结构灵活多样支持推荐、搜索、广告场景常用的深度学习模型 FTRL、FM、FFM、W
4、DL、DCN、DeepFM、MTL等MLX的模型能力 Optimizer FTRL、AdaGrad、AdaDelta、ADAM、AmsGrad、etc Loss Function LogLoss、SquareLoss、Cross Entropy、etc 评估指标 AUC、Loss、MAE、RMSE 支持外部eval工具，计算MAP、NDCGMLX模型能力提供离线、近线、在线全流程解决方案，各阶段提供扩展方案，降低算法迭代成本；支持Online Learning，提供从近线到在线的模型数据通路；提供从召回到排序全流程的模型解决方案，为业务提供最佳实践；提供系统的平台化工具，为用户提供易用的界面
5、操作；MLX平台架构MLX平台架构模型训练框架基于Worker+PS架构搭建 Worker 模型计算引擎（Engine）计算图框架（Graph）模型计算引擎Engine 模型结构处理与PS通信交换模型参数计算图的计算计算图框架Graph 计算逻辑抽象op，通过op组合形成模型结构提供正向（forward）、反向（backward）、Loss的操作扩展模型训练框架模型可变计算路径应用场景离线预计算运行阶段模型召回，ANN检索计算图裁剪粗排模型，降低线上计算量Parameter Server 分布式Sharding 模型分片存储，支持超大规模模型数据并行计算，加速Optim
6、izer计算低频特征过滤 Counting Bloom Filter 概率方式模型数据通路 Base+Delta方式增量提供ACK机制，确保模型正确性PS的参数放置策略模型数据的统一管理 Ps分布式分片的均衡，避免分片大小不一致模型结构模型参数NN网络矩阵按行切分，解决请求包不均衡问题特征按照Hash方式分布式存储PS的多模型训练模型并行调超参提高内存使用效率 grid search random search model group内共享特征key的存储PS的长尾效应超大规模模型-高扇出的分布式PS 长尾效应：单个分片的抖动（网络、CPU）对请求影响变大单分片4个9的可用
7、性 16分片整体可用性：99.99%16=99.84%64分片整体可用性：99.99%64=99.36%128分片整体可用性：99.99%128=98.72%Backup Request Jeff Dean在解决BigTable高扇出时提出的方案Backup RequestPredictorPS Reqreply 1req 1reply 2 reply Nreq Nreq 2Backup Request超过tCancel Request副本1副本2副本1副本2PS Shard 1PS Shard 2流式模型的通路持久化存储 PS快速failover 本地disk存储，持久化对齐kafka的数
8、据 Compaction机制，降低load数据量流式拼接框架 Online Learning对数据流的要求不重不丢：重复的数据会使模型有偏，数据的缺失会使模型丢失重要信息数据有序性：数据乱序会导致样本穿越的现象 Log Join框架双流拼接框架，通过组合方式支持多流拼接基于Event Time的Window机制拼接方式基于Low Watermark解决流乱序、流延迟等流式常见问题流式拼接 Low Watermark机制定义了流式数据的时钟，不可逆性 Smooth low watermark：异常数据时间跳变 Checkpoint解决不重不丢问题外存解决大数据量性能问题在引擎中流
9、转log key，特征数据在外存在线预估服务分业务场景支持轻量级predictor：仅支持模型的计算，特征由业务传入，无状态设计自定义predictor：提供业务抽象，支持业务自定义逻辑，插件化实现逻辑阶段抽象，业务根据自身需求选择性实现数据获取：根据业务的自身逻辑获取特征原始数据特征抽取：将特征数据进行转换，转换成模型所需的格式，比如离散化模型计算：传入转换后的特征数据，调用模型计算引擎特征抽取框架特征编码方式通过明文hash的方式编码适用于特征的动态增长不需要预分配，提高处理效率框架与实现分离提供op形式的特征抽取类逻辑一致性：在线、近线、离线目录美团超大规模
10、模型场景简介超大规模机器学习MLX MLX平台目标 MLX平台架构模型场景应用召回模型排序模型美团推荐场景的应用漏斗模型召回模型排序模型推荐的漏斗模型漏斗模型策略漏斗模型数千千万数百召回粗排精排候选集模型召回解决方案模型的设计样本&特征的设计模型的通路召回模型设计基于双塔的模型召回架构基于用户和item的DNN结构产出用户和item两侧向量基于ANN的向量相似度检索 Item侧离线计算，形成ANN词表用户侧向量实时计算，通过ANN找出相似item向量样本&特征设计 LBS的负例采样特征设计用户侧：能设计完整的特征，个性化，实时特征 Item侧：预计算带来的副作
11、用，不能使用实时特征与位置相关的negative sampling全体集合同地域无效信息多仅曝光分布偏差大点击(+)样本分布召回模型通路在线、近线、离线全流程解决方案排序模型解决方案粗排模型精排模型粗排模型粗排阶段的特点候选集大，通常在千到万级别线上的响应时间要求高，通常在几到十几ms 简单模型计算耗时短：线性模型LR、树模型模型表达能力不足，效果一般复杂模型 DNN模型解决耗时是关键，利用预计算解决耗时问题效果保障：保证用户的个性化信息，降低候选集计算复杂度精排模型精排阶段的特点候选集较少，通常在百级别线上耗时相对宽松，几十毫秒（视效果而定）小规树模型精排模型的特点结构复杂，怎么有效果怎么来1.Random Forest2.XGBoost 特征多样：历史行为、统计值、id类特征、高维交叉,etc.模型发展历程树模型：Random Forest、XGBoost 小规模DNN：MLP、小规模的Wide&Deep 大规模离散DNN：大规模的Wide&Deep、DeepFM、DCN总结超大规模深度学习工程实现数据并行、模型并行在线、近线、离线逻辑一致性实时模型业务应用召回模型，ANN搜索粗排模型，模型预计算精排模型，大规模离散DNN

展开阅读全文

163文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：超大规模深度学习在美团的应用课件.pptx
链接地址：https://www.163wenku.com/p-3389779.html

三亚风情

内容提供者

实名认证

联系作者