数据库课件:第十二讲 关联分析方法 .ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据库课件:第十二讲 关联分析方法 .ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库课件:第十二讲 关联分析方法 数据库 课件 第十二 关联 分析 方法
- 资源描述:
-
1、1第12讲 关联分析方法本讲讲授目标:本讲讲授目标:1. 关联规则挖掘的基本概念关联规则挖掘的基本概念2. 关联规则挖掘的过程关联规则挖掘的过程3. 关联规则挖掘的关联规则挖掘的Apriori算法算法4. 关联规则价值衡量的方法关联规则价值衡量的方法2一. 关联规则挖掘的基本概念关联规则挖掘的基本概念1. 购物篮分析引发关联规则挖掘的例子购物篮分析引发关联规则挖掘的例子 问题:问题:“什么商品组或集合什么商品组或集合, 顾客多半会在一次购顾客多半会在一次购物中同时购买?物中同时购买?”例例购买计算机与购买财务管理软件的关联规则购买计算机与购买财务管理软件的关联规则可表示为:可表示为:compu
2、ter financial_management_software support=2%,confidence=60% support为支持度,为支持度,confidence为置信度。为置信度。该规则表示:在所分析的全部事务中,有该规则表示:在所分析的全部事务中,有2的事的事务同时购买计算机和财务管理软件;在购买计算务同时购买计算机和财务管理软件;在购买计算机的顾客中机的顾客中60也购买财务管理软件。也购买财务管理软件。3关联规则关联规则 关联(关联(Associations)分析的目的是为了)分析的目的是为了挖掘隐藏在数据间的相互关系,即对于给挖掘隐藏在数据间的相互关系,即对于给定的一组项目
3、和一个记录集,通过对记录定的一组项目和一个记录集,通过对记录集的分析,得出项目集中的项目之间的相集的分析,得出项目集中的项目之间的相关性。关性。 项目之间的相关性用关联规则来描述,关项目之间的相关性用关联规则来描述,关联规则反映了一组数据项之间的密切程度联规则反映了一组数据项之间的密切程度或关系。或关系。 4置信度和支持度置信度和支持度 support(XY)(包含包含X和和Y的事务数的事务数 / 事务总数事务总数)100confidence(XY)(包含包含X和和Y的事务数的事务数 / 包含包含X的事务数的事务数)100 置信度和支持度均大于给定阈值(即最小置信度阈置信度和支持度均大于给定阈
4、值(即最小置信度阈值和最小支持度阈值)。即:值和最小支持度阈值)。即:support(XY) min_supconfidence(XY) min_conf 的关联规则称为强规则;否则称为弱规则。的关联规则称为强规则;否则称为弱规则。 数据挖掘主要就是对强规则的挖掘。通过设置最小数据挖掘主要就是对强规则的挖掘。通过设置最小支持度和最小置信度可以了解某些数据之间的关联支持度和最小置信度可以了解某些数据之间的关联程度。程度。5频繁项集频繁项集定义定义在关联规则挖掘算法中,把项目的在关联规则挖掘算法中,把项目的集合称为项集(集合称为项集(itemset),包含有),包含有k个项目个项目的项集称为的项集
5、称为k-项集。包含项集的事务数称为项集。包含项集的事务数称为项集的出现频率,简称为项集的频率或支持项集的出现频率,简称为项集的频率或支持度计数。度计数。 如果项集的出现频率大于或等于最小支持如果项集的出现频率大于或等于最小支持度度S与与D中事务总数的乘积,则称该项集满足中事务总数的乘积,则称该项集满足最小支持度最小支持度S。如果项集满足最小支持度,则。如果项集满足最小支持度,则称该项集为频繁项集(称该项集为频繁项集(frequent itemset )。)。6强规则强规则 强规则强规则XY对应的项集(对应的项集(XY)必定是频)必定是频繁集。因此,可以把关联规则挖掘划分为繁集。因此,可以把关联
6、规则挖掘划分为以下两个子问题:以下两个子问题: 根据最小支持度找出事务集根据最小支持度找出事务集D中的所有频繁项中的所有频繁项集。集。 核心核心 根据频繁项集和最小置信度产生关联规则。根据频繁项集和最小置信度产生关联规则。 较易较易 7举例 例例 购买商品事务如下表所示,设最小购买商品事务如下表所示,设最小支持度为支持度为50%, 最小可信度为最小可信度为 50%, 则可得则可得到以下关联规则:到以下关联规则: 规则规则1: A C (50%, 66.6%) 规则规则2: C A (50%, 100%)8关联规则挖掘的分类关联规则挖掘的分类 布尔关联规则布尔关联规则 量化关联规则量化关联规则
展开阅读全文