误差分析课件聚类分析之谱系聚类法.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《误差分析课件聚类分析之谱系聚类法.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 误差 分析 课件 聚类分析 谱系 聚类法
- 资源描述:
-
1、 聚类分析之 -谱系聚类法谱系聚类法类间距离及其递推公式谱系聚类法的应用分析谱系聚类法的步骤谱系聚类引言 谱系聚类法也称为系统聚类法,是目前应用较为广泛的一种聚类方法,它根据植物分类学的思想对研究对象进行分类。在植物分类学中,分类的单位是:门、纲、目、科、属、种,其中种是分类的基本单位。分类单位越小,它所包含的植物就越少,植物间的共同特征就越多。谱系聚类 利用这种分类思想,谱系聚类法首先视各样品自成一类,然后把最相似的样品聚为小类,再将已聚合的小类按其相似性再聚合,随着相似性的减弱,最后将一切子类都聚合成一个大类,从而得到一个按相近性大小聚结起来的谱系图,再进一步根据实际情况确定合适的分类个数
2、。谱系聚类问题判断两个样品最相似的依据是什么?谱系聚类类间距离及其递推公式 常用的类间距离有四种:最短距离 最长距离 类平均距离 重心距离类间距离谱系聚类 以 分别表示样品 ,以 简记 与 的距离 ,设 分别表示两个类,它们分别含有 个样品.我们用 来表示类 与 之间的距离.ji,jixx,ijdixjxjixxd,qpGG,qpnn,最短距离pqDpGqGijGjGipqdDqpmin,即用两类中样品之间距离最短者作为两类间的距离.谱系聚类最长距离ijGjGipqdDqpmax,即用两类中样品之间距离最长者作为这两类间的距离.类平均距离ijGjGiqppqdnnDqp1 即用两类中所有两两样
3、品之间的距离的平均作为两类之间的距离.221ijGjGiqppqdnnDqp或者 即用两类中所有两两样品之间的平方距离的平均作为两类间的平方距离.谱系聚类重心距离设类 中的样品为 ,则其均值pG)(1px)(2px)(pnpxpnipippxnx1)(1称为类 的重心.pGqppqxxdD,其中,分别是 的重心,即用两类的重心之间的距离作为两类间的距离.pxqxqpGG,谱系聚类 按照谱系聚类的思想,先将样品聚合成小类,再逐步聚为大类.设类 由类 合并所得,则 包含 个样品.为了更方便地实现谱系聚类,我们需要建立类间距离的递推公式,即计算类 与其他类 之间的距离.类间距离的递推公式rGqpGG
4、,rGqprnnnrGqpkGk,谱系聚类常用的四种类间距离的递推公式最短距离ijGjGirkdDkrmin,ijGjGiijGjGiddkqkpminmin,minqkpkDD,min最长距离ijGjGirkdDkrmax,ijGjGiijGjGiddkqkpmaxmax,maxqkpkDD,max谱系聚类类平均距离ijGjGikrrkdnnDkr1kqkpGjGiijGjGiijkrddnn,1qkrqpkrpDnnDnn对于类平均距离的下列定义方式 221ijGjGiqppqdnnDqp同理可得递推公式如下:222qkrqpkrprkDnnDnnD谱系聚类重心距离由 的合并集 的重心是
展开阅读全文