商务智能课件:第5章 数值预测.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《商务智能课件:第5章 数值预测.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 商务智能课件:第5章 数值预测 商务 智能 课件 数值 预测
- 资源描述:
-
1、Principles and Applications of Business IntelligenceChap 5 :数值预测 1Introduction to商务智能方法与应用第5章 数值预测Chapter5: Numeric predictionPrinciples and Applications of Business IntelligenceChap 5 :数值预测 2主要内容 5.1 数值预测的概念 5.2 回归方法 5.3 回归树与模型树 5.4 K近邻数值预测 5.5 预测误差的度量Principles and Applications of Business Intelli
2、genceChap 5 :数值预测 35.1 数值预测的概念Principles and Applications of Business IntelligenceChap 5 :数值预测 4分类 vs. 数值预测 有监督的预测问题 数值预测预测的是数值,通常是连续类型的数值连续数值Continuous value描述属性(自变量)目标属性(因变量)Principles and Applications of Business IntelligenceChap 5 :数值预测 5数值预测方法 回归分析 回归树,模型树 K近邻MYCTMMINMMAXCACHCHMINCHMAXPRP125256
3、600025616128198298000320003283226929800032000328322202980003200032832172268000320006483231823160003200064163236723160003200064163248923160006400064163263623320006400012832641144400512350041640表5.1 数据集CPU的子集 机器周期时间、最小内存、最大内存、缓存、最小信道、最大信道及相对性能Principles and Applications of Business IntelligenceChap 5
4、:数值预测 65.2 回归方法Principles and Applications of Business IntelligenceChap 5 :数值预测 75.2 回归分析 5.2.1 一元线性回归 5.2.2 多元线性回归 5.2.3 非线性回归Principles and Applications of Business IntelligenceChap 5 :数值预测 8 Linear regression: Y = 0 + 1X+ - Parameters: 0 , 1- Random variable: N(0, 2)一元线性回归$0$10$20MonthlyProfitAge
5、206040minimizePrinciples and Applications of Business IntelligenceChap 5 :数值预测 9线性回归分析的基本步骤(1)构建包含因变量和自变量的训练集;(2)通过散点图,确认因变量和自变量之间的近似线性关系;(3)估计系数,构建模型;(4)检验模型;(5)利用模型进行预测Principles and Applications of Business IntelligenceChap 5 :数值预测 10 基于观测样本估计参数:- 用最小二乘法拟合(x1, y1) (x2,y2) 一元线性回归分析$0$10$20MonthlyP
6、rofitAge206040minimizeiiyabxPrinciples and Applications of Business IntelligenceChap 5 :数值预测 11least squares (最小二乘法)- 残差平方和,- 最小化SSE- : mean values of X and Y- sxx 称为x的校正平方和, sxy 称为校正交叉乘积和- syy称为y的校正平方和。2211()nnEiiiiiSSyy-12111()()()11niixyinxxiinniiiixxyysbsxxaybxybxnn- xy和Principles and Applicatio
7、ns of Business IntelligenceChap 5 :数值预测 12一元线性回归baPrinciples and Applications of Business IntelligenceChap 5 :数值预测 13模型检验 回归平方和SSR 总离差平方和SST: 将y的均值作为总体估计值时的误差 SST=SSE+SSR- 总离差平方和中被回归模型解释的部分为回归平方和 拟合优度检验- R2 , adjusted R square- n为样本个数,k为自变量的个数21()nRiiSSyy-21(y)nTiiSSy-2221/(1)111(1)/(1)1RETTETSSSSRS
8、SSSSSnknRRSSnnk - - -2R2211()nnEiiiiiSSyy-Principles and Applications of Business IntelligenceChap 5 :数值预测 14回归模型的显著性检验 假设: H0:b=0; H1: b0 可以证明在H0成立的情况下由下式定义的F符合F(1,n-2)分布 给定显著性水平,查自由度为(1,n-2)的F分布临界值表得临界值F (1,n-2),若由上式计算的F0 F (1,n-2)则因变量和自变量之间的线性关系显著,假设H0被拒绝/(2)RESSFSSn-iiyabxPrinciples and Applicat
9、ions of Business IntelligenceChap 5 :数值预测 15回归系数的显著性检验 为了检验回归模型中每个回归系数的显著性,可以推导出系数a和b的样本方差 可以证明tb=b/Sb和ta=a/Sa均符合自由度为(n-2)的t分布 其中重要的是检验系数b是否为0。因此需要检验假设H0: b=0; H1: b0 给定显著性水平,查自由度为(n-2)的t分布表,得到t (n-2)若tb t (n-2),则拒绝假设H0,即回归系数b显著 同时可以计算出P 值(p value),一般以P 0.05 为显著, P F (k, n-k-1)=- 若F0F (n-k-1) 则因变量和自
10、变量之间的线性关系显著,假设H0被拒绝REMSFMSPrinciples and Applications of Business IntelligenceChap 5 :数值预测 21方差分析表方差类型方差类型 自由度自由度平方和平方和均方差均方差F 回归回归kSSRMSRF= MSR/ MSE残差残差n-k-1SSEMSE总离差总离差n-1SST 表5.3 回归分析结果中通常返回的方差分析表的构成Principles and Applications of Business IntelligenceChap 5 :数值预测 22回归系数的显著性检验 回归系数的显著性检验可以采用t检验。对于
展开阅读全文