书签 分享 收藏 举报 版权申诉 / 26
上传文档赚钱

类型熵值法原理及应用实践课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4259432
  • 上传时间:2022-11-23
  • 格式:PPT
  • 页数:26
  • 大小:798.56KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《熵值法原理及应用实践课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    熵值法 原理 应用 实践 课件
    资源描述:

    1、美商天睿信息系统(北京)有限公司2013年3月熵值法原理及应用实践培训目标理解熵值法的原理1.学会使用熵值赋权2.领悟熵值应用实践3.熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用熵值法?熵值法是做什么用的?1411/23/2022Teradata Confidential日常工作中常常需要计算指标权重专家打分法(德尔菲法)层次分析法(AHP)主成份分析法因子分析法多元回归赋权法线性回归逻辑回归熵值法请大家想一想,你知道的几种指标赋权方法?请大家想一想,你知道的几种指标赋权方法?511/23/2022Teradata Confidential赋权算法分类对于权重的确定,目前已提出

    2、各种不同的方法,可以分为:往往依靠专家打分和定性分析精确性不够主观性太强一般采用数理统计方法和技术过于依赖数据,缺乏业务指导很多方法不能反映指标对目标的影响方向主观赋权客观赋权 二者结合二者结合使用最有效使用最有效611/23/2022Teradata Confidential“熵”是一种客观的赋权方法“熵”原本是物理中热力学概念,后来发展为信息论的熵值法理论,在指标赋权指标赋权方面的应用比较广泛。“熵”是不确定性信息的度量(就好比人的身高、体重,可以用来衡量人的体格):信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。熵大熵大越不确定信息量小影响小权重小小熵小熵小越

    3、确定信息量大影响大权重大大711/23/2022Teradata Confidential指标赋权中熵值法的一般原理根据熵的特性,我们可以用熵值来判断某用熵值来判断某个指标的离散个指标的离散程度程度:指标指标熵值越小,熵值越小,离离散散程度越大,该指标对综合评价的影响程度越大,该指标对综合评价的影响(即权重)也就越大(即权重)也就越大。熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用熵值法?熵值法是做什么用的?1911/23/2022Teradata Confidential“熵”的一般计算公式nffHniiiln)ln(1niiiiXXf1其中:,n为总样本数,iX为指标值 一个

    4、规划求一个规划求极值问题极值问题1011/23/2022Teradata Confidential“权”的一般计算公式miijjHHw1)1()1(其中:为第j个指标(维度)的熵,m为指标总数jH1111/23/2022Teradata Confidential利用样本数据上感受下熵的变化请大家动一动手,用请大家动一动手,用EXCEL计算出样本数据的熵!计算出样本数据的熵!感受下不同分布的指标数据算出来的熵值会怎样变化?感受下不同分布的指标数据算出来的熵值会怎样变化?详见附录详见附录11211/23/2022Teradata Confidential熵值法的一般步骤步骤一步骤一确立指标体系确立

    5、指标体系步骤二步骤二清洗指标极值清洗指标极值步骤三步骤三归一化指标处理归一化指标处理步骤四步骤四计算指标计算指标“熵熵”和和“权权”步骤五步骤五指标加权计算得分指标加权计算得分1311/23/2022Teradata Confidential熵值法的一般步骤之一:确立指标体系案例解说案例解说 我们用手游认知客户挖掘模型实例来解说熵值法计算指标权重的全过程。下图是手游认知客户挖掘模型的二级二级指标指标评评价价体系体系,其中各个维度指标对应的权重系数均是通过熵值法计算出来的。下面具体看下模型中“手游认知能力手游认知能力”部分指标权重的计算过程。一一级级二二级级1411/23/2022Teradat

    6、a Confidential熵值法的一般步骤之二:清洗指标极值案例解说案例解说方法方法:即剔除各指标中极大或者极小的值,一般用比较合理的上下限值替换这些极值。目的是减少极值数据对该指标的熵的影响;原则原则:剔除占样本总数不到1-2%但指标值贡献率超过20-30%以上的极值样本样本id游戏流量(K)贡献率98163580.8%98264010.8%98366310.8%98466350.8%98571930.9%98674320.9%98779931.0%98883851.0%98986911.1%990100381.2%991102631.3%992104171.3%993109361.3%9

    7、94113071.4%995142541.8%996150731.9%997153261.9%998164802.0%999165422.0%1000615737.6%样本id游戏流量(K)贡献率98161070.9%98261070.9%98361070.9%98461070.9%98561070.9%98661070.9%98761070.9%98861070.9%98961070.9%99061070.9%99161070.9%99261070.9%99361070.9%99461070.9%99561070.9%99661070.9%99761070.9%99861070.9%9996

    8、1070.9%100061070.9%去极值后1511/23/2022Teradata Confidential熵值法的一般步骤之三:归一化指标处理案例解说案例解说方法方法:指标归一化过程也称之为指标的无量纲化,即将指标实际值转化为不受量纲影响的指标平价值。方法比较多,具体见附录无纲量化方法一览;原则原则:比较常用的是临界值法和Z-score法(更合理,保持了更合理,保持了数据的连续性,减少数据信息丢失数据的连续性,减少数据信息丢失),最终将所有指标转化为正区间里面,二者具体处理如下:sxxzii_iiiiixxxxyminmaxmin分箱处理逻辑处理临界值法临界值法Z-score法法1,2,

    9、3,100(0,11611/23/2022Teradata Confidential熵值法的一般步骤之四:计算指标“熵”和“权”案例解说案例解说nffHniiiln)ln(1手游历史付费类似,按此公式还可以继续计算出访问次数手游H访问天数手游H和)1()1()1()1(手游访问天数手游访问次数手游历史付费手游历史付费手游历史付费HHHHw同理可以计算出和访问次数手游W访问天数手游W熵权1711/23/2022Teradata Confidential熵值法的一般步骤之五:指标加权计算得分案例解说案例解说 利用以上3个指标的权重和归一化指标值,计算上级指标的分数:手游认知能力得分=0.336*手

    10、游历史付费金额 +0.212*手游访问次数 +0.452*手游访问天数。当然,模型其他部分的底层指标权重和一级指标权重均可以按以上步骤计算得到,并一层层由下往上进行加权,最终得到模型的综合得分。方法方法:计算综合得分就是指标合成的过程,一般可以采用加法原理和乘法原理;原则原则:最常用的是加法合成法,其具体处理如下:加法合成法加法合成法熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用熵值法?熵值法是做什么用的?11911/23/2022Teradata Confidential熵值法的优点在于其客观、准确和简便优点优点 熵值法能深刻反映出指标的区分能力,进而确定权重。这种思想和我们的

    11、得分评价模型指标选择的机理是机理是一致的一致的;是一种客观赋权法,有理论依据,相对主观赋权具有较高的可信度和精确度较高的可信度和精确度;算法简单,实践起来比较方便操作方便操作,无需借助其他分析软件实现。2111/23/2022Teradata Confidential熵值法不是万能赋权法缺缺点点 智能程度不够智能程度不够高高。与多元回归和主成份等统计方法不同,它不能考虑指标与指标间横向的影响(如:相关性),更不能确定指标对目标/得分的影响方向(如:正相关或负相关);同其他客观赋权法一样,若无业务经验的指导,权重权重可能失真可能失真;对样本的依赖性比较大对样本的依赖性比较大,随着建模样本变化,权

    12、重会有一定波动;2211/23/2022Teradata Confidential项目中合理应用熵值法的几点个人经验:必须结合结合专家打分专家打分法法才可以发挥熵值法的优势。事实上,指标评价体系建立的基础就是专家经验;在确定权重前,需要完全确定指标对目标得分的影响指标对目标得分的影响方向方向。非线性的指标要么剔除,要么进行预处理;熵值法对底层指标比较适用对底层指标比较适用,而对上层指标权重需要重点借助专家经验;不要怕麻烦,好好处理所有指标的极值问题,对权重的优化有好处;个人经验个人经验2311/23/2022Teradata Confidential附录1.计算熵值的数据样本2.熵值法的SQL实现脚本3.无纲量方法一览2411/23/2022Teradata Confidential附录附录1.计算熵值的数据样本附录2.熵值法的SQL实现脚本2511/23/2022Teradata Confidential附录3 无量纲方法一览阀阀值值法法(临界值法临界值法)1、2、3、4、Z-score法法1、比重法比重法1、2、折线型折线型曲线型曲线型iiixxymaxiiiixxxymaxmaxiiixxxyminiiiiixxxxyminmaxminsxxzii_iiixxy2iiixxy直线直线型型2611/23/2022Teradata ConfidentialThank you

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:熵值法原理及应用实践课件.ppt
    链接地址:https://www.163wenku.com/p-4259432.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库