数据挖掘技术与应用-回归分析预测模型课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据挖掘技术与应用-回归分析预测模型课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 技术 应用 回归 分析 预测 模型 课件
- 资源描述:
-
1、 技术培训-数据挖掘技术与应用回归分析预测模型1 回归分析预测模型回归分析预测模型v1.1 一元线性回归预测模型一元线性回归预测模型 v1.2 多元线性回归预测模型多元线性回归预测模型 v1.3 非线性回归预测模型非线性回归预测模型 1.1 一元线性回归预测模型一元线性回归预测模型u一元回归公式一元回归公式u以影响预测的各因素作为自变量或解释变量x和因变量或被解释变量y有如下关系:u u称为一元线性回归模型(One Variable Linear Regression Model),其中:u是一个随机变量称为随机项;a,b是两个常数,称为回归系数(参数);i表示变量的第i个观察值,共有n组样本
2、观察值。1,2,.,iiiyabxuin1.1 一元线性回归预测模型一元线性回归预测模型u参数的最小二乘估计参数的最小二乘估计u相应于yi的估计值,与yi之差称为估计误差或残差,以表示,。显然,误差的大小是衡量估计量好坏的重要标志。我们以误差平方和最小作为衡量总误差最小的准则,并依据这一准则对参数a,b作出估计。令:222111()()nnniiiiiiiiyyyabx1.1 一元线性回归预测模型一元线性回归预测模型u参数的最小二乘估计参数的最小二乘估计u使Q达到最小以估计出的方法称为最小二乘法(Method of Least-Squares)。由多元微分学可知,使Q达到最小的参数的的最小二乘
3、估计量(Least-Squares Estimator of Regression Coefficient)必须满足:niiiiniiixxbaybQxbayaQ110)(20)(2(i i=1,2,=1,2,n n)1.1 一元线性回归预测模型一元线性回归预测模型u参数的最小二乘估计参数的最小二乘估计u解上述方程组得11122111()nnniiiiiiiinnniiiiiix yxyx ynxybxxxxx aybx1.1 一元线性回归预测模型一元线性回归预测模型u参数的最小二乘估计参数的最小二乘估计u解上述方程组得11122111()nnniiiiiiiinnniiiiiix yxyx
4、ynxybxxxxx aybx其中其中 niixnx11niiyny111.1 一元线性回归预测模型一元线性回归预测模型u参数的最小二乘估计参数的最小二乘估计u若令niixxxxl12)(niiyyyyl12)()(1yyxxliniixy则上式可以写成则上式可以写成 xxxyllbxbya1.1 一元线性回归预测模型一元线性回归预测模型u相关性检验相关性检验u 一般情况下,在一元线性回归时,用相关性检验较好,相关系数R(Sample Correlation Coefficient)是描述变量x与y之间线性关系密切程度的一个数量指标。yyxxxyniiniiniiilllynyxnxyxnyx
5、R1221221(1 1 R R 1 1)1.1 一元线性回归预测模型一元线性回归预测模型u相关性检验相关性检验u查相关系数临界值表,若R R(n2),则线性相关关系显著,通过检验,可以进行预测;反之,没有通过检验,该一元回归方程不可以作为预测模型。1.1 一元线性回归预测模型一元线性回归预测模型u应用回归方程进行预测应用回归方程进行预测u1.预测值的点估计u当方程通过检验后,由已经求出的回归方程和给定的某一个解释变量x0,可以求出此条件下的点预测值,输入x0的值,则预测值为。1.1 一元线性回归预测模型一元线性回归预测模型u2.区间估计u为估计预测风险和给出置信水平(Confidence L
6、evel),应继续做区间估计(Interval Estimation),也就是在一定的显著性水平下,求出置信区间(Confidence Region),即求出一个正实数,使得实测值y0以的概率落在区间 内,满足 P =。00(,)yy00(,)yy1.1 一元线性回归预测模型一元线性回归预测模型u2.区间估计u由于预测值和实际值都服从正态分布,从而预测误差u 也服从正态分布,从正态分布,202()1(2)1xxxxtnnl()/2yyxylb ln 求出 后将得出结论:在的概率下,预测范围为00(,)yy。00yy1.1 一元线性回归预测模型一元线性回归预测模型u一元线性回归模型实例一元线性回
7、归模型实例u下表给出的是1991-2002年某城市的水路货运量,下面将根据此表数据建立一元线性回归模型并对2002年以后的水路货运量进行预测。1.1 一元线性回归预测模型一元线性回归预测模型序号序号xi年份年份水路货运量水路货运量yi1199116592199219893199321954199422555199523296199623757199723648199823549199924181020002534112001256812200228351.1 一元线性回归预测模型一元线性回归预测模型u计算计算,x y5.6)121110987654321(12111niixnx2323)283
8、525682534241823542364237523292255219519891659(12111niiyny1.1 一元线性回归预测模型一元线性回归预测模型u分别计算分别计算lxx,lyy,lxy21()30.2520.25 12.256.252.250.252.256.25 12.2520.2530.25143nxxiilxx21()440896 111556 163844624362704 1681 961 90254452160025262144954557nyyiilyy1.1 一元线性回归预测模型一元线性回归预测模型u分别计算分别计算lxx,lyy,lxy5.106992816
9、5.11025.7385.2375.465.20269170448150336525125.52455.42115.3955.2315.1415.052)5.0(6)5.1()68()5.2()128()5.3()334()5.4()664()5.5()(1yyxxliniixy1.1 一元线性回归预测模型一元线性回归预测模型u计算系数计算系数所以此预测模型为 =1836.657+74.822x ,a b822.741435.10699xxxyllb657.18365.6822.742323xbyayabx1.1 一元线性回归预测模型一元线性回归预测模型u 1991-2002年某市水路货运量一
展开阅读全文