聚类分析详解ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《聚类分析详解ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 详解 ppt 课件
- 资源描述:
-
1、-报告人: -主要内容引言聚类分析原理聚类分析的种类聚类分析应注意的问题聚类分析应用聚类分析工具及案例分析-引言“物以类聚,人以群分”市场营销中的市场细分和客户细分问题。可从客户分类入手,根据客户的年龄、职业、收入、消费金额、消费频率、喜好等方面进行单变量或者多变量的客户分组。不足:不足:客户群划分带有明显的主观色彩,需要有丰富的行业经验才能做到比较合理和理想的客户细分。主要表现在,同一客户细分段中的客户在某些方面并不相似,而不同客户细分段中的客户在某些特征方面却又很相似。解决方法:解决方法:从数据自身出发,充分利用数据进行客户的客观分组,使诸多有相似性的客户被分在同一组,而不相似的客户被区分
2、到另一组中。这时便可采用聚类分析方法。-主要内容引言聚类分析原理聚类分析原理聚类分析的种类聚类分析应注意的问题聚类分析应用聚类分析工具及案例分析-聚类分析定义聚类:聚类:聚类(clustering)是对大量未知标注的数据集,按数据的内在相似性内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小,其过程被称为聚类。-聚类分析定义聚类分析定义:聚类分析定义:聚类分析是将样品样品或变量变量按照他们性质上的亲疏程度亲疏程度进行分类的多元统计分析方法。进行聚类分析时,用来描述物品或变量的亲疏程度通常有两个途径:一是把每个样品或变量看成是多维空间上的一个点,在多维坐标中,定义
3、点与点、类与类之间的距离,用点与点间距离距离来描述样品或变量的亲疏程度;二是计算样品或变量的相似系数相似系数,用相似系数来描述样品或变量之间的亲疏程度。-聚类分析特点聚类分析是一种建立分类的多元统计分析方法,它能将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度亲疏程度在没有先验知识没有先验知识的情况下进行自动分类,产生多个分类结果。类内部的个体在特征上具有相似性,不同类间个体特征的差异性较大。-聚类分析特点编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664C商厦8482D商厦9188E商厦9490 把商厦分成两类: 把商厦分为三类: 没有指定分类标准,大家为什么
4、会这么分呢? 从数据出发,根据性质上的亲疏程度亲疏程度进行分类!A、B为一类,C、D、E为一类A、B为一类,C为一类,D、E为一类-聚类分析特点编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664C商厦8482D商厦9188E商厦9490 把商厦分成两类: 把商厦分为三类: 没有指定分类标准,大家为什么会这么分呢? 从数据出发,根据性质上的亲疏程度亲疏程度进行分类!A、B为一类,C、D、E为一类A、B为一类,C为一类,D、E为一类样本样本变量变量-亲疏程度的度量方法亲疏程度的度量也叫相似性度量,方法主要有两个:(1) 距离距离常用来度量样品样品之间的相似性;(2)相似系数相似系
5、数常用来度量变量变量之间的相似性。编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664C商厦8482D商厦9188E商厦9490样本样本变量变量-距离-距离欧氏(Euclidean)距离平方欧氏(Squared Euclidean)距离明氏(明科夫斯基 Minkowski)距离切比雪夫(Chebychev)距离兰氏(Lance和Willianms)距离马氏(Mahalanobis)距离斜交空间距离其他详细定义请参考教材:信息分析方法与应用王伟军,清华大学出版社SPSS统计分析方法及应用薛薇,电子工业出版社-距离编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664
6、-距离编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664E商厦9490-1ijc , (0)ijxaxb ab1ijc , i jijjicc, i j相似系数-1ijc , (0)ijxaxb ab1ijc , i jijjicc, i j相似系数-相似系数编号编号购物环境购物环境服务质量服务质量A商厦7368B商厦6664-参考教材:应用多元统计分析高惠璇,北京大学出版社相似系数-主要内容引言聚类分析原理聚类分析的种类聚类分析的种类聚类分析应注意的问题聚类分析应用聚类分析工具及案例分析-聚类分析的种类(1)系统聚类法(也叫分层聚类或层次聚类)(2)动态聚类法(也叫快速聚类
7、)(3)模糊聚类法(4)图论聚类法 -系统聚类法对比-常用的系统聚类方法一、最短距离法 二、最长距离法三、中间距离法四、类平均法五、重心法六、离差平方和法(Ward方法) -一、最短距离法定义类与类之间的距离为两类最近样品间的距离,即,minKLKLiji Gj GDd 详细步奏和实例详细步奏和实例-最短距离法的聚类步骤(1) 规定样品之间的距离,计算 个样品的距离矩阵 ,它是一个对称矩阵。(2) 选择 中的最小元素,设为 ,则将 和 合并成一个新类,记为 ,即(3) 计算新类 与任一类 之间距离的递推公式为n 0D 0DKLDKGLGMGMKLGGGMGJG,minminmin, minmi
展开阅读全文