书签 分享 收藏 举报 版权申诉 / 28
上传文档赚钱

类型面向大数据的搜索与推荐算法.pptx

  • 上传人(卖家):无敌的果实
  • 文档编号:2526805
  • 上传时间:2022-04-29
  • 格式:PPTX
  • 页数:28
  • 大小:780.10KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《面向大数据的搜索与推荐算法.pptx》由用户(无敌的果实)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    面向 数据 搜索 推荐 算法
    资源描述:

    1、面向大数据的搜索与推荐算法 本次分享主要介绍面向大数据的机器学习算法在小米搜索与推荐的典型应用 背景:数据驱动使得小米互联网业务以及大数据平台规模得到了持续增长,也助推了搜索和推荐技术的发展Outline 引言 场景 算法 架构 用户隐私小米搜索与推荐引言引言 -Introduction小米 商业模式:硬件+互联网+新零售 触达用户各种场景的产品矩阵和生态系统引言引言 Introduction移动互联网时代的挑战 入口分散化多样化,获取用户成本变高 分散到各个app,不再集中于浏览器 缺乏统一的账号和大数据的积累 用户的数据分散,不互通,不利于为用户提供精准的个性化服务Introduction

    2、引言引言小米的优势 海量的内容数据内容数据和用户数据用户数据 统一的账号体系账号体系,数据打通 统一了小米体系内的用户数据,构建立体多维的用户画像用户画像 搜索推荐和广告等多项业务使用 丰富的应用入口入口 移动搜索 、浏览器 、应用商店、有品商城 架构架构搜索+推荐面向大数据的算法场景场景移动搜索推荐搜索提示算法算法 Algorithms移动搜索 为用户提供便捷、个性化的移动搜索服务 覆盖 应用,视频,新闻,问答 等 移动搜索中的关键技术 意图识别 查询分析 相关性计算 排序算法算法 Algorithms移动搜索场景 - 点击模型排序 用户行为大数据,数十亿样本 搜索 浏览 点击 以点击模型为

    3、例,介绍使用用户行为数据优化Ranking及搜索体验 Click as implicit feedback算法算法 AlgorithmsCOEC模型 clicks over expected clicks (COEC)注:引用自1点击模型点击模型DBN模型注:引用自1算法算法 Algorithms问答场景 - 语义相似度计算 DSSM模型注:引用自5算法算法 Algorithms问答场景 - 语义相似度计算 C-DSSM 英文输入为例 改进: 词性 位置注:引用自2新闻推荐新闻推荐新闻推荐场景 - CTR预估 大数据 用户画像 用户行为 根据已曝光的结果用户是否点击生成样本 十亿级样本算法算法

    4、 Algorithms技术演进 线性模型 LR FTRL FM(两两特征组合) GBDT+LR(有一定高层次特征组合能力) 树模型 GBDT 深度神经网络模型 Wide&Deep DNN DeepFM大数据下的算法performance探讨引用自6Performance面向大数据的算法架构架构架构 Architecture大数据小规模数据12组成数据处理数据处理Spark为主为主MapReduce线上预测线上预测pmmltf-ser ving分布式分布式训练框架:训练框架:tensorflow,lightgbm,自研框架自研框架不同场景下解决方案 点击模型 Spark,Scala实现 GBDT

    5、 Spark - lightgbm3 C-DSSM Spark - tensorflow DNN parameter server大数据下的隐私保护大数据隐私保护大数据隐私保护大数据隐私保护 算法需要丰富的数据以提供个性化的服务 推荐 广告 搜索 数据的广泛使用增加隐私泄露的风险 隐私泄露案数量逐年上升 社交网络 酒旅 在线广告 电子商务 配送 .大数据隐私保护大数据隐私保护小米用户数据隐私保护实践 GDPR - 通用数据保护条例 PII数据 Personal Identifier Information 可以通过该数据定位到用户,则该数据被认为是PII imei, phone 等在数据层做加密处理 访问敏感数据需要单独的权限 用户不同意搜集数据的情况 数据做non PII处理 涉及个性化的场景提供降级服务 无法进行邮件的推广谢谢!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:面向大数据的搜索与推荐算法.pptx
    链接地址:https://www.163wenku.com/p-2526805.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库