书签 分享 收藏 举报 版权申诉 / 29
上传文档赚钱

类型京东虚假交易识别系统.pptx

  • 上传人(卖家):无敌的果实
  • 文档编号:5271831
  • 上传时间:2023-03-04
  • 格式:PPTX
  • 页数:29
  • 大小:1.25MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《京东虚假交易识别系统.pptx》由用户(无敌的果实)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    虚假 交易 识别 系统
    资源描述:

    1、京东虚假交易识别系统虚假交易识别的需求与挑战虚假交易的危害商业分析客户体验电商生态未经剔除虚假交易成分的商业数据,例如销售额、转化率等等,不能反映平台真实的业绩与成长,将误导商业决策刷单伪造交易历史骗取消费者对商品、品牌的认可;冲击平台的搜索排名体系以吸引流量,这些使得平台对商品质量的客观评价指标对消费者失去参考价值平台会因虚假交易损失在消费者当中的信誉;而刷单者的不正当竞争也会冲击卖方体系,造成商家流失;廉价的刷单成本更会侵蚀正规的营销渠道,例如广告业务刷单行业现状成为营销、赚钱手段 渗透各类综合、垂直电商以及O2O平台刷单手法隐蔽、逼真、多变规模化、市场化、产业化 多种刷单软件和工具协助提

    2、高效率以及隐藏刷单者真实身份“人肉”刷单,模拟真实客户行 刷单者通过社区分享反侦察心得 涌现出各种刷单公司、集团、平台,“从业人员”众多,“产业”日趋成熟 提供一站式服务,并且敢于承诺“服务质量”反刷单的挑战多维度数据引证策略的敏捷迭代快速、准确与高召回基于单个行为特点的识别方法,面对逼真的刷手行为日渐困难,需要多种维度数据上深入挖掘实体信用指标作为依据适应刷单手法的变化,决策识别系统能够预警并演进对层出不穷的刷单手段,既要抓得多,又要抓得准,还要抓得快系统需求DimensionalityFlexibilityReproducibilityAdaptabilityEssentials系统需求分

    3、布式大数据系统基本需求 高可用性 可扩展性 低延迟Essentials系统需求多样化数据源适应性 多种业务类型:订单、账户、支付、物流、评论 不同数据形式:批量数据(数据仓库)、流式数据(消息队列)、京东云 对于批量数据,解决到达时间不一致问题;对于流式数据,使用流式处理,同时落地为批量数据 数据的变化AdaptabilityEssentials系统需求结果可复现性 判定需要保留现场历史,以便回溯判定的过程 当时点的用于生成特征的业务数据 当时点的用于识别刷单的特征数据 当时点的策略及系统(模型规则、参数、代码、配置)有助于解决分歧、复议ReproducibilityAdaptabilityE

    4、ssentials系统需求决策系统灵活性 可扩展:支持多模型规则协作 热插拔:随时上线、下线模型规则,支持突发业务变更 应对业务变化:机器学习算法与业务规则结合;通用、稳定的模型与专用、易变的逻辑隔离FlexibilityReproducibilitAdaptabilityEssentials系统需求服务多维度应用 识别结果在高维度上聚合,生成个体风险指标 除用于反刷单外,帮助构建风险、信用账户体系、商家信用体系、商品质量监控DimensionalityFlexibilityReproducibilitAdaptabilityEssentials京东订单交易数据特点 生命周期长:从用户产生消费

    5、冲动到对商品发表评论,一个订单关联到的数据跨度可长达数周甚至数月 数据种类多:日志、买卖方属性、商品属性、交易属性、支付、物流等等数据 数据多变:在订单生命周期内交易数据的变动是十分常见的搜索关注购买结算支付发货物流评价反刷单:在更长的时间跨度上,从海量持续变动的数据中挖掘刷单行为的痕迹系统架构设计实践京东反刷单系统架构特征计算决策与模型下游服务Hadoop Stack+Spark 因地制宜,根据数据和作业的特点选择适合的数据处理技术 精简选择,用简洁一致的解决方案处理复杂多变需求京东反刷单系统架构数据预处理 批量数据、批量作业 数据仓库:Hive+Pig 云平台等数据源:定时任务 ETL:P

    6、ig 流式数据 持久化:Camus ETL:Spark Streaming 作业管理和调度:Oozie京东反刷单系统架构特征计算 离线特征 初级特征:特征工厂(Feature Factory)高阶特征 图模型算法:Spark GraphX 传统机器学习方法:Spark MLlib 聚类、序列分析等方法:自实现 在线特征 时间窗口统计:Spark Streaming京东反刷单系统架构特征管理 离线特征:特征仓库(Feature Warehouse)模型训练更新 特征共享 在线特征:JimDB 实时特征检索京东反刷单系统架构模型与决策引擎系统 模型训练与更新 浅层模型方法:Spark MLlib

    7、其他方法:自实现 深度学习方法:评估调研中 决策系统 基于模型方法:Spark 基于规则方法:Drools京东反刷单系统架构结果归档与推送 归档 数据压缩:Avro 推送 实时请求:JSF RPC框架 消息推送:JMQ系统需求与架构实践如何满足分布式系统基本需求?需求需求方案方案高可用性可扩展性低延迟监控+主从、旁路系统一切皆分布式数据时效性数据降级计算容量不足优化特征计算订单交易数据属性订单生命周期内多次识别刷单可疑度系统需求与架构实践 监控无处不在 任务监控 开源框架:Oozie、Spark-集成原生监控 京东框架:JMS、JimDB、JSF-京东统一监控平台 数据质量监控 上游数据/下游

    8、推送:量级监控 离线/在线识别结果:识别统计报表与Dashboard 计算的权衡 历史数据 最新数据 手动优化 自动生成 单次识别 多次识别 分段旁路系统 候场环境与灾备:特征计算、模型与决策系统、下游推数三阶段系统需求与架构实践如何满足大数据系统基本需求?如何适应多样化数据源?需求需求方案方案多种业务类型特征工厂,对特征计算中数据依赖和过程的高度抽象不同数据形式通过ETL将数据统一到两类:流式数据和批量数据特征工厂:初级特征要素空间Space对象的时间跨度以及筛选条件,如限于过往半年的订单记录,限于移动端日志维度Dimension按空间筛选后,聚合的字段,如账户名、商品标识符测度Metric

    9、s按维度聚合后,群组上的统计方式,如计数、均值、方差、信息增益最后将测度按照维度关联到订单记录上时,目标的范围,如仅适用于当天的订单记录,仅适用于自营业务的订单记录特征工厂:通用特征计算框架初级特征计算框架 提供上述要素的配置语言表达形式 由配置自动构建计算特征的数据查询语言与作业调度系统需求与架构实践如何满足大数据系统基本需求?如何适应多样化数据源?如何让结果可复现?需求需求方案方案保留现场历史识别结果中包含 所有特征数据 所有模型识别结果 决策引擎配置 决策引擎代码版本(CI自动生成提交)使用Avro压缩并存档系统需求与架构实践如何满足大数据系统基本需求?如何适应多样化数据源?如何让结果可复现?如何提高决策系统灵活性?需求需求方案方案可扩展支持多模型协作的决策引擎 使用元分类器+模型的决策结构 元分类器下辖各类机器学习模型或者规则模型 元分类器与模型构成决策引擎拓扑热插拔决策引擎拓扑由配置动态生成 离线系统:配置更改即生效 在线系统:配置更改后由定时任务侦测并更新系统需求与架构实践如何满足大数据系统基本需求?如何适应多样化数据源?如何让结果可复现?如何提高决策系统灵活性?服务多维度应用服务下游应用店铺评级金融征信商品管控反刷单广告营销评论管理搜索排序账户管理

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:京东虚假交易识别系统.pptx
    链接地址:https://www.163wenku.com/p-5271831.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库