熵值法原理及应用实践课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《熵值法原理及应用实践课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 熵值法 原理 应用 实践 课件
- 资源描述:
-
1、美商天睿信息系统(北京)有限公司2013年3月熵值法原理及应用实践培训目标理解熵值法的原理1.学会使用熵值赋权2.领悟熵值应用实践3.熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用熵值法?熵值法是做什么用的?1411/23/2022Teradata Confidential日常工作中常常需要计算指标权重专家打分法(德尔菲法)层次分析法(AHP)主成份分析法因子分析法多元回归赋权法线性回归逻辑回归熵值法请大家想一想,你知道的几种指标赋权方法?请大家想一想,你知道的几种指标赋权方法?511/23/2022Teradata Confidential赋权算法分类对于权重的确定,目前已提出
2、各种不同的方法,可以分为:往往依靠专家打分和定性分析精确性不够主观性太强一般采用数理统计方法和技术过于依赖数据,缺乏业务指导很多方法不能反映指标对目标的影响方向主观赋权客观赋权 二者结合二者结合使用最有效使用最有效611/23/2022Teradata Confidential“熵”是一种客观的赋权方法“熵”原本是物理中热力学概念,后来发展为信息论的熵值法理论,在指标赋权指标赋权方面的应用比较广泛。“熵”是不确定性信息的度量(就好比人的身高、体重,可以用来衡量人的体格):信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。熵大熵大越不确定信息量小影响小权重小小熵小熵小越
3、确定信息量大影响大权重大大711/23/2022Teradata Confidential指标赋权中熵值法的一般原理根据熵的特性,我们可以用熵值来判断某用熵值来判断某个指标的离散个指标的离散程度程度:指标指标熵值越小,熵值越小,离离散散程度越大,该指标对综合评价的影响程度越大,该指标对综合评价的影响(即权重)也就越大(即权重)也就越大。熵值法原理及应用实践2 熵值法如何计算权重?3 怎样合理应用熵值法?熵值法是做什么用的?1911/23/2022Teradata Confidential“熵”的一般计算公式nffHniiiln)ln(1niiiiXXf1其中:,n为总样本数,iX为指标值 一个
4、规划求一个规划求极值问题极值问题1011/23/2022Teradata Confidential“权”的一般计算公式miijjHHw1)1()1(其中:为第j个指标(维度)的熵,m为指标总数jH1111/23/2022Teradata Confidential利用样本数据上感受下熵的变化请大家动一动手,用请大家动一动手,用EXCEL计算出样本数据的熵!计算出样本数据的熵!感受下不同分布的指标数据算出来的熵值会怎样变化?感受下不同分布的指标数据算出来的熵值会怎样变化?详见附录详见附录11211/23/2022Teradata Confidential熵值法的一般步骤步骤一步骤一确立指标体系确立
5、指标体系步骤二步骤二清洗指标极值清洗指标极值步骤三步骤三归一化指标处理归一化指标处理步骤四步骤四计算指标计算指标“熵熵”和和“权权”步骤五步骤五指标加权计算得分指标加权计算得分1311/23/2022Teradata Confidential熵值法的一般步骤之一:确立指标体系案例解说案例解说 我们用手游认知客户挖掘模型实例来解说熵值法计算指标权重的全过程。下图是手游认知客户挖掘模型的二级二级指标指标评评价价体系体系,其中各个维度指标对应的权重系数均是通过熵值法计算出来的。下面具体看下模型中“手游认知能力手游认知能力”部分指标权重的计算过程。一一级级二二级级1411/23/2022Teradat
6、a Confidential熵值法的一般步骤之二:清洗指标极值案例解说案例解说方法方法:即剔除各指标中极大或者极小的值,一般用比较合理的上下限值替换这些极值。目的是减少极值数据对该指标的熵的影响;原则原则:剔除占样本总数不到1-2%但指标值贡献率超过20-30%以上的极值样本样本id游戏流量(K)贡献率98163580.8%98264010.8%98366310.8%98466350.8%98571930.9%98674320.9%98779931.0%98883851.0%98986911.1%990100381.2%991102631.3%992104171.3%993109361.3%9
展开阅读全文