BI数据挖掘交流方案.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《BI数据挖掘交流方案.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BI 数据 挖掘 交流 方案
- 资源描述:
-
1、内容纲要内容纲要 BI的相关背景 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具1BIBI的相关背景的相关背景BI(Business Intelligence,商业智能)是目前全球IT市场中非常热门的一个话题;其关键推进因素是ERP等系统的相对完善后,形成了海量数据,如何发挥这些数据的价值其实就是BI所需要解决的问题;BI是 数据-信息-知识 的一个逐步转化过程;BI系统主要由 数据仓库DW(Data Warehouse),联机分析处理OLAP(Online Analytical Processing),数据挖掘-DM(Data Mining)三大部分组成;2BIBI的相
2、关背景的相关背景BI系统结构3内容纲要内容纲要 BI的相关背景 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具4典型的业务问题典型的业务问题5数据挖掘都可以应用到何处?数据挖掘都可以应用到何处?6何谓数据挖掘?何谓数据挖掘?数据挖掘是一个从海量数据中抽取前所未知的,数据挖掘是一个从海量数据中抽取前所未知的,可理解的,可操作信息的过程。可理解的,可操作信息的过程。7数据库与数据挖掘发展历程数据库与数据挖掘发展历程8数据挖掘是一门交叉学科数据挖掘是一门交叉学科数据挖掘数据挖掘数据库技术统计学其他学科信息科学机器学习可视化技术9内容纲要内容纲要 BI的相关背景 数据挖掘的基础知
3、识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具10数据挖掘的过程数据挖掘的过程商业理解商业理解数据理解数据理解数据准备数据准备 数据 挖掘建立模型建立模型模型评估模型评估模型发布模型发布11商业理解商业理解 定义商业目标 定义数据挖掘目标12数据理解数据理解 需要的数据 可以获得的数据 对可获得的数据进行观察、分析 用直方图显示输入数据分布 聚类以发现孤立点 在保持数据特征的基础上抽样 过滤不想要的数据 值映射13数据准备数据准备一定要保证数据质量!14建立模型建立模型 确定抽样规则 选择合适的算法 调整算法的参数15模型评估模型评估 使用一组新数据评估构建好的模型16模型发布模型发布
4、制作成自动化处理软件包,上线使用。17数据挖掘过程中工作量比例数据挖掘过程中工作量比例18数据挖掘的过程数据挖掘的过程数据仓库选择的数据选择转换挖掘理解转换后的数据可理解的信息抽取的信息19内容纲要内容纲要 BI的相关背景 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具20业务问题与数据挖掘算法间关系业务问题与数据挖掘算法间关系Debt$40KQ QQ QQ QQ QI II I1 12 23 34 45 56 6factor 1factor 2factor n神经网络神经网络 Neural NetworksNeural Networks聚类分析聚类分析 Clusteri
5、ngClusteringOpenAccntAdd NewProductDecreaseUsage?Time序列分析序列分析 Sequence AnalysisSequence Analysis决策树决策树 Decision TreesDecision Trees 倾向性分析信用特性分析 客户保留 客户生命周期管理 目标市场 价格弹性分析 客户细分 市场细分 倾向性分析 客户保留 目标市场 欺诈检测关联分析关联分析 AssociationAssociation 市场组合分析 套装产品分析 目录设计 交叉销售21数据挖掘的类型数据挖掘的类型 预测型预测型数据挖掘:数据挖掘:使用已知知识构建模型,用
6、以预测未来。描述型描述型数据挖掘:数据挖掘:寻找数据中的模式,使用找到的模式指导决策。22数据挖掘技术数据挖掘技术(预测型/描述型)分类 结果将落入哪个类别中?影响预测结果的主要因素是什么?值预测 这一事件发生的可能性是多大?23数据挖掘技术数据挖掘技术 聚类 存在哪些逻辑上的群集?关联规则 事件之间存在怎样的联系?序列模式 这个事件之后会发生那些事件?相似时间序列 这个结果是否与以前的一个模式相同?24三种主要的数据挖掘技术三种主要的数据挖掘技术分类(客户流失)聚类(客户细分)关联规则(购物篮分析)25分类分类分类算法采取行动!26决策树分类决策树分类训练:基于历史数据,创建决策树27决策树
7、分类决策树分类应用:基于历史数据,创建决策树28决策树分类的参数决策树分类的参数 一般数据挖掘工具在应用决策树分类算法时,可调整的参数:输入变量 误差矩阵(代价矩阵)最大树深度 节点最大纯度 节点最少记录数29神经网络分类神经网络分类 输入层(i)隐藏层(j)输出层(k)x1 x2 xi Wij Wjk O j O k 前馈是指信号先前传播,输入-隐层-输出结点结点(神经元)神经元)30BPBP算法原理算法原理 网络结构的确定1.输入层结构由输入变量(属性)来定。每个属性为一个输入结点;2.输出层结构由输出结果来定。有几个输出值,就有几个输出结点;3.隐藏层 层数和结点数点的确定:主要靠经验。
展开阅读全文