大数据时代的数据挖掘与商务智能培训课件(PPT-80页).ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据时代的数据挖掘与商务智能培训课件(PPT-80页).ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 时代 挖掘 商务 智能 培训 课件 PPT 80
- 资源描述:
-
1、12345数据挖掘数据挖掘678910111213数据仓库和数据挖掘项目提到日程数据仓库和数据挖掘项目提到日程n数据分析、决策支持系统、商业智能数据分析、决策支持系统、商业智能(BIBI)、)、知识管理、客户关系管理知识管理、客户关系管理(CRM)(CRM)、物流与供应链管理物流与供应链管理(SCM)(SCM)、企业资源计划、企业资源计划(ERP)(ERP)、各种预测。、各种预测。n政府、科技部门、大型企业(工厂,公司,政府、科技部门、大型企业(工厂,公司,商场),经济部门、金融机构(银行、证商场),经济部门、金融机构(银行、证券、保险)、电子商务、电子政务、各种券、保险)、电子商务、电子政务
2、、各种“金金”工程。工程。14n数据仓库数据仓库 将不同数据源、多年的数据经将不同数据源、多年的数据经“整合整合”成成一个有组织的便于分析的结构化的数据环一个有组织的便于分析的结构化的数据环境。境。组织数据方法。组织数据方法。n数据挖掘:数据挖掘:从数据中找出(推出,归纳出,预测、挖从数据中找出(推出,归纳出,预测、挖掘)有用的信息,规律,知识。掘)有用的信息,规律,知识。分析数据方法。分析数据方法。1516171819决策支决策支持系统持系统OLAP数据挖掘数据挖掘数数 据据 仓仓 库库数数 据据 库库各种信息系统各种信息系统各种管理系统各种管理系统搜索、抽取搜索、抽取过滤过滤万维网万维网信
3、息发布信息发布信息检索信息检索ACRMCRM2021(B)DataInformation(A)Knowledge(Arrangement)(Transmit)(A)Knowledge transmitted by character,sign,voice,etc.(B)Data arranged to be useful for decision makingINFORMATION(Recognition)(C)Knowledge(C)Recognition memorized personally or socially(D)Judgment or a system of judgment
4、which has objective validityKNOWLEDGE(D)Knowledge(Judgment)(D)Knowledge(Judgment)What is the energy to bring such transformation?(E)Computers ability to judge things automatically(F)Peoples ability to understand and learn thingsINTELLIGENCEInformation ScienceManagement ScienceKnowledge Science+Infor
5、mation,Knowledge,and Intelligence22A theory of organizational knowledge creation,which suggests that new knowledge is created by the interaction between explicit and tacit knowledge through the spiral of Socialization,Externalization,Combination,and Internalization.Shared mental modelsor technical s
6、kills1Metaphors,analogies,concepts,hypotheses,or models2Linkingexplicitknowledge3Learning by doing4I.Nonaka and H.Takeuchi The Knowledge-Creating Company.How Japanese Companies Create the Dynamics of Innovation.Oxford University Press,1995.GroupexplicitknowledgeIndividual explicitknowledgeIndividual
7、tacitknowledgeGrouptacitknowledgeCombinationInternalizationSocializationExternalizationKey Factor in Establishing the SchoolProf.Nonaka23242526银行银行 17%17%生物生物/基因基因 8%8%E E商务商务/Web 15%/Web 15%欺诈检测欺诈检测 8%8%保险保险 6%6%投资投资/股票股票 4%4%药品药品 5%5%零售业零售业 6%6%科学数据科学数据 8%8%电信电信 11%11%其他其他 11%11%272829303132333435
8、数据仓库数据仓库 数据清理与数据集成数据清理与数据集成过滤过滤 数据库数据库数据挖掘数据挖掘方法库方法库其它数据源其它数据源知识库知识库World-WideWebOther InfoRepositories36各行业电子商务网站各行业电子商务网站算算法法层层商商业业逻逻辑辑层层行行业业应应用用层层商业应用商业应用商业模型商业模型挖掘算法挖掘算法CRM产品推荐产品推荐客户细分客户细分客户流失客户流失客户利润客户利润客户响应客户响应关联规则、序列模式、分类、聚集、神经元网络、偏差分析关联规则、序列模式、分类、聚集、神经元网络、偏差分析WEB挖掘挖掘网站结构优化网站结构优化网页推荐网页推荐商品推荐商
9、品推荐。基因挖掘基因挖掘基因表达路径分析基因表达路径分析基因表达相似性分析基因表达相似性分析基因表达共发生分析基因表达共发生分析。银行银行电信电信零售零售保险保险制药制药生物信息生物信息科学研究科学研究。相关行业相关行业371.业务分析Data SourceData Source 2.数据收集与整理3 数据分析与处理4.财务指标展示6.数据挖掘结果的解释和展示7.系统建设8.尝试应用5.数据挖掘建模3839404142 KDD 过程可分为三个阶段:数数据据准准备备(data preparation)、数数据据挖挖掘掘,以及结果的解解释释评评价价(interpretation and evalu
10、ation),如图所示。可视化用户界面 数据库 目标数据 预处理好的数据 转换后数据 挖掘出的知识 有用的知识 选择/抽样 预处理 数据转换 数据挖掘 解释评价4344Data CleaningData IntegrationDatabasesData WarehouseTask-relevant DataSelectionData MiningPattern Evaluation4546 47484950515253挖掘结果(获得知识的)挖掘结果(获得知识的)5455发布挖掘结果(获得知识的)发布挖掘结果(获得知识的)Crisp-DM 1.0CRISP-DM 2.0 SIG WORKSHOP
11、 ANNOUNCEDCHICAGO,SEPTEMBER 26,2006 56575859Data Mining/Analytic Software Tools 534 voters(May 2007)6061代代特征特征数据挖掘算法数据挖掘算法集成集成分布计算分布计算模型模型数据模型数据模型第一第一代代作为一个独作为一个独立的应用立的应用支持一个或者支持一个或者多个算法多个算法 独立的系统独立的系统单个机器单个机器向量数据向量数据第二第二代代和数据库以和数据库以及数据仓库及数据仓库集成集成多个算法:能多个算法:能够挖掘一次不够挖掘一次不能放进内存的能放进内存的数据数据数据管理系数据管理系统,包
12、括数统,包括数据库和数据据库和数据仓库仓库同质、局同质、局部区域的部区域的计算机群计算机群集集有些系统支持有些系统支持对象对象,文本和文本和连续的媒体数连续的媒体数据据第三第三代代和预测模型和预测模型系统集成系统集成 多个算法多个算法数据管理和数据管理和预测模型系预测模型系统统intranet/extranet网网络计算络计算支持半结构化支持半结构化数据和数据和webweb数数据据第四第四代代和移动数据和移动数据/各种计算设各种计算设备的数据联备的数据联合合 多个算法多个算法数据管理、数据管理、预测模型、预测模型、移动系统移动系统移动和各移动和各种计算设种计算设备备普遍存在的计普遍存在的计算模
13、型算模型 Robert Grossman的观点的观点(National Center for Data Mining,University of Illinois at Chicago)62n特点特点支持一个或少数几个数据挖掘算法支持一个或少数几个数据挖掘算法 挖掘向量数据(挖掘向量数据(vector-valued datavector-valued data)数据一般一次性调进内存进行处理数据一般一次性调进内存进行处理 典型的系统如典型的系统如Salford SystemsSalford Systems公司早期的公司早期的CARTCART系系统统(www.salford-)(www.salf
展开阅读全文