数据挖掘工具软件介绍weka课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据挖掘工具软件介绍weka课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 工具软件 介绍 weka 课件
- 资源描述:
-
1、数据挖掘软件介绍目前较为著名的数据挖掘软件n传统的数据挖掘套件(Classic suites):SAS Enterprise Miner 5.3SPSS Clementine 12n开源数据挖掘软件(Open Source):RapidMiner 4.2 http:/ 2.0 http:/www.knime.org/Weka 3.6n专门化的数据挖掘软件(Specialized):Viscovery SOMiner 5.0prudsys Discovery 5.5/Basket Analyzer 5.2Bissantz Delta Master 5.3.62目前较为著名的数据挖掘软件n自动化数
2、据挖掘软件(Self-Acting):KXEN Analytic Framework 4.04nBI产品内置的数据挖掘软件(BI Vendors):SAP NetWear 7.0 Data Mining WorkbenchOracle 11g Data MiningMicrosoft SQL Server 2005 Analysis Servicesn其他优秀的软件nTeradata Warehouse MinernIBM的DB2 Intelligence MinernAngoss的KnowledgeSTUDIOnUnica3WEKAn简介http:/www.cs.waikato.ac.nz/
3、ml/weka中文论坛http:/bbs2.wekacn.org/n功能ProgramLogWindowMemeryUsageExitVisualization4WEKA PLOTROCTreeVisualizerGraphVisualizerBoundaryVisualizerToolsArffViewerSqlViewerBayesNetEditer5WEKAApplicationsExplorerExperimenterKnowledgeFlowSimpleCLIHelpWeka homepageHOWTOs,code snippets,etc.Weka on SourceforgeSy
4、stemInfo6WEKA nWEKA Explorer 1.Preprocess.选择和修改要处理的数据。2.Classify.训练和测试关于分类或回归的学习方案。3.Cluster.从数据中学习聚类。4.Associate.从数据中学习关联规则。5.Select attributes.选择数据中最相关的属性。6.Visualize.查看数据的交互式二维图像。7.Memory Information.在 log 栏中显示 WEKA 可用的内存量。8.Run garbage collector.强制运行 Java 垃圾回收器,搜索不再需要的内存空间7WEKA EXPLORERn载入数据n1.O
5、pen file.打开一个对话框,允许你浏览本地文件系统上的数据文件。n2.Open URL.请求一个存有数据的 URL 地址。n3.Open DB.从数据库中读取数据(注意,要使之可用,可能需要编辑nweka/experiment/DatabaseUtils.props 中的文件)n4.Generate.从一些数据生成器(DataGenerators)中生成人造数据。8WEKA EXPLORERn处理属性处理属性n1.No.一个数字,用来标识数据文件中指定的各属性的顺序。n2.选择框.允许勾选关系中呈现的各属性。n3.Name.数据文件中声明的各属性的名称。n当点击属性列表中的不同行时,右边
6、Selected attribute 一栏的内容随之改变。这一栏给出了列表中当前高亮显示的属性的一些描述:n1.Name.属性的名称,和属性列表中给出的相同。n2.Type.属性的类型,最常见的是分类型(Nominal)和数值型(Numeric)。n3.Missing.数据中该属性缺失(或者未指定)的实例的数量(及百分比)。n4.Distinct.数据中该属性包含的不同值的数目。n5.Unique.唯一地拥有某值的实例的数目(及百分比),这些实例每个的取值都和别的不一样。9WEKA EXPLORER ATTRIBUTESnPattern.n让用户基于 Perl 5 正则表达式来选择属性。例如所
7、有以M开头的属性。n筛选器筛选器filternGenericObjectEditor 对话框n应用筛选器 注意:一些筛选器会依据是否设置了 class 属性来做出不同的动作。(点击直方图上方那一栏时,会出现一个可供选择的下拉列表。)特别的,“supervised filters”(监督式筛选器)需要设置一个 class 属性,而某些“unsupervised attribute filters”(非监督式属性筛选器)将忽略 class 属性。注意也可以将 Class 设成 None,这时没有设置 class属性。10WEKA EXPLORER CLASSIFYn分类器分类器选择分类器测试选项n
8、1.Using training set.根据分类器在用来训练的实例上的预测效果来评价它。n2.Supplied test set.从文件载入的一组实例,根据分类器在这组实例上的预测效果来评价它。点击 Set 按钮将打开一个对话框来选择用来测试的文件。n3.Cross-validation.使用交叉验证来评价分类器,所用的折数填在Folds 文本框中。n4.Percentage split.从数据集中按一定百分比取出部分数据放在一边作测试用,根据分类器这些实例上预测效果来评价它。取出的数据量由%一栏中的值决定。11WEKA EXPLORER CLASSIFYn分类器输出文本分类器输出文本nCl
展开阅读全文