BoxCox变换方法及其实现运用课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《BoxCox变换方法及其实现运用课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BoxCox 变换 方法 及其 实现 运用 课件
- 资源描述:
-
1、Box-Cox 变换方法及其实现运用变换方法及其实现运用主要内容主要内容Box-Cox转换的应用前提1数据不同转换方法的比较2Box-Cox转换的具体内容3Box-Cox转换的实例效果4Box-Cox变换变换Box和Cox在1964年提出的变换可以使线性回归模型满足线性性、独立性、方差齐性以及正态性的同时,又不丢失信息,此种变换称之为BoxCox变换。后经过一定的推广和改进,扩展了其应用范围。 应用前提应用前提在做线性回归的过程中,一般线性模型假定: 线性性独立性方差齐性正态性E(Y)是X中各变量的线性函数相互独立服从正态分布12.n、21( ) .( )nDD 12.n、2, (0)Y XN
2、I ,应用前提应用前提在处理实际经济问题和社会问题时,由于海量数据比较凌乱,同时在建立回归模型时,个别变量的系数通不过。例如生物医学等数据的特殊性,往往不可观测的误差 可能是和预测变量相关的,不服从正态分布,于是给线性回归的最小二乘估计系数的结果带来误差,为了满足上述四个条件而不丢失信息,有时需要改变一下数据形式,进而Box-Cox变换得到了广泛推广。非正态数据的不同处理方法及其比较非正态数据的不同处理方法及其比较普通数据转换方法 该方法坚持正态性假设,通过各种数据转换函数将非正态数据转换为正态,例如原始测量值为 ,转换后的对应值为 ,常用的几种数据转换方式为: 对数转换: 平方根转换: 倒数
3、转换: 平方根后取倒数: 平方根后再取反正弦: 幂转换: 其中 ,参数ixiyln()iiyxiiyx1iiyx1iiyxsin()iiyArcx1/1()nniixx 1.5,111iixyx表中数据来自于豪爵摩托车用户满意度问卷调查的样本。通过大量重复试验,得到如下规律:P值为0.003视为平方转换的一个界点,如果正态检验得到的p值大于0.003,通过平方转换一般可实现正态化处理,否则通过平方转换很难实现正态化处理,其他几种转换方法也往往达不到正态处理的目的。Box-Cox变换方法变换方法上述问题下,当P值小于0.003时,由于普通数据转换方法很难使其实现正态化处理,运用Box-Cox变换
4、方法对原数据进行正态化处理就表现出巨大的价值。当P值大于0.003时,两种变换方法均可,但优先考虑普通的平方变换。Box-Cox变换和逆变换公式变换和逆变换公式Box-Cox变换是对反应变量y进行变换,变换公式为:逆变换公式为:显然,y的Box-Cox变换是一个变换族,由可变参数 决定着具体变换的形式,当 时,该变换为对数变换。1()()(1) ,0exp(),0yyy01,0()log,0yyy( )广义的广义的Box-Cox变换公式变换公式在前面的变换中,运用的log(y),因此必须要求y0.但对于一般的数据,对于任意取值的y的Box-Cox变换可用下面的公式:其中,参数c就是为了使 ,g
5、的默认取值为1,也可取 ,为y的几何平均。显然参数c的取值很好确定,公式中需要估计的参数就是 .为了简便处理,一般理论上我们假定反应变量y0.()1,0()lo g (),0ycgycgy0yc 1yy两种公式对比两种公式对比通过对比Box-Cox特殊变换公式和数据变换公式,我们可以发现Box-Cox特殊变换公式就是数据变换,只是在形式上有一定的改进。n当当 时,时,n当当 时时n当当 时,时,n当当 时时,iiyx=0.5= - 11iiyx( )=22yy()1= 1yy=0.5= -1两种转换方式的优劣势对比两种转换方式的优劣势对比两种转换方式的优劣势对比两种转换方式的优劣势对比保持原始
展开阅读全文