书签 分享 收藏 举报 版权申诉 / 17
上传文档赚钱

类型基于大数据技术的互联网征信-课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3496381
  • 上传时间:2022-09-07
  • 格式:PPT
  • 页数:17
  • 大小:1.97MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《基于大数据技术的互联网征信-课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    基于 数据 技术 互联网 课件
    资源描述:

    1、 基于大数据技术的互联网征信 葛伟平 2015年6月7日拉卡拉联合四大上市公司共同组建 央行首批授权的个人征信机构 同时持有企业征信和个人征信牌照的征信机构 拉卡拉跨行还款转账数据生活服务数据POS交易数据电商数据理财数据小贷数据拓尔思股票代码:300229中国互联网行为数据挖掘领先企业,拥有中国最强的大数据技术及舆情分析数据旋极信息股票代码:300324中国两家营改增服务商之一,拥有企业税务类服务数据蓝色光标股票代码:300068全球第六大传播集团,是大数据营销的代表企业梅泰诺股票代码:300038三大通讯运营商服务数据及全国企业工商服务数据考拉征信公司互联网征信特点基于云大物移智技术,提供

    2、互联网征信需要的大数据存储、计算能力、建模平台和访问便利性纳入一切能够反映能力或意愿的数据:信用类数据为主体购物、理财、缴费等数据社交关系位置数据用户上传/提供的有效数据互联网信息以经验为主的专家评分卡转换到以大数据为主的全量数据分析 高频、秒级的信 用评分评级响应互联网征信本质仍然是征信,互联网是渠道和工具!趣味大数据分析记性最差的星座(最容易忘记还钱,贡献了不少额外利息):射手最抠门的星座(最后一天的最后一刻还钱,不愿给利息):双子最土豪的星座(12星座中借钱最少):天秤存在的挑战:数据资源 数据的碎片化 数据的稀缺性 数据的精细化 数据的理解度 数据的高成本存在的挑战:大数据处理 大数据

    3、采集 大数据存储 大数据计算考拉征信应对:数据资源引入股东数据提供支撑借助外部合作数据积极牵头或参与制定数据标准和互换数据与中科院合作成立实验室制定模型知识图谱考拉征信应对:数据资源组建数据抓取团队考拉征信应对:大数据处理传统数据平台、Hadoop平台和NoSQL数据平台的结合传统平台存储评分结果离线式计算基于Hadoop分布式处理环境Hive平台R结合Hadoop用于大数据统计分析快速的大量数据勘察基于Impala,从小时级缩减到秒级NoSQL处理社交关系考拉征信应对:大数据处理图数据库在社交关系/朋友圈模式应用可视化效果找到显性特征、显著变量通过“弱关系”找到与征信业务的“强关联”考拉征信

    4、模型技术框架考拉个人信用分考拉商户信用分互联网金融行业征信产品信用评分引擎 数据理解模型组合和模型部署 变量选择样本准备模型设计变量处理数据分析模型训练参数调整模型验证模型跟踪与反馈征信产品征信建模ETL数据接口平台(清洗、转换、脱敏)传统数据平台Hadoop数据平台(Hive仓库)数据采集拉卡拉业务数据其他股东数据互联网抓取数据公开数据外部合作单位数据贫困人口征信数据(待接入)数据标准管理数据质量管理数据安全管理NoSQL数据平台考拉职业信用分考拉模型训练数据到最终模型的递进式过程:就业务细节业务特征理解听取业务专家的定性叙述数据异常值处理、聚集处理、数据规范化进行数据的违约关系分析对变量进

    5、行变换分组分析对最终选择变量进行建模运用多种模型技术和算法进行训练测试结合可解释性、预测精准性及训练成本权衡后选择适用算法或组合子模型和通用基础子模型组合考拉征信模型的KS值处于合理稳定范围考拉信用分值分布考拉个人信用分特点:上亿数量级客户缴费、理财、购物类信息金融社交关系和位置信息互联网信息考拉商户信用分信用记录商户及法人的过往信用记录及信用账户历史记录等履约能力综合能力体现,尤其指经营能力交易行为交易行为特征、互联网舆情信息等成长能力发展规模和速度能力企业属性基本信息,经营范围、注册资金等经营稳定经营波动状况考拉商户信用分特点:真实、整合、实时的商户运营情况成长能力画像,反映变化交易行为特征和互联网信息现状:中国有1千万以上小微商户传统财务指标无法有效核实小微商户信用状况小微商户贷款难考拉信用分考拉信用分信贷旅游保险租车租房婚介商户促销理财餐饮酒店考拉信用分应用:信用价值的体现谢谢!

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基于大数据技术的互联网征信-课件.ppt
    链接地址:https://www.163wenku.com/p-3496381.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库