优质实用课件精选-气候统计第三章-判别分析与聚类分析.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《优质实用课件精选-气候统计第三章-判别分析与聚类分析.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优质 实用 课件 精选 气候 统计 第三 判别分析 聚类分析
- 资源描述:
-
1、第三章第三章 判别分析与聚类分析判别分析与聚类分析 在多元统计分析中,广泛使用一种统计应在多元统计分析中,广泛使用一种统计应用方法,即根据表征某一事物或现象类型的用方法,即根据表征某一事物或现象类型的随机变量的取值样本分布,将事物或现象划随机变量的取值样本分布,将事物或现象划分为若干类型。例如,在气候分析中,需将分为若干类型。例如,在气候分析中,需将气候划分成若干类型,干旱气候,湿润气候,气候划分成若干类型,干旱气候,湿润气候,半干旱气候等,究竟划分几类?选择湿度、半干旱气候等,究竟划分几类?选择湿度、相对湿度、降水量、蒸发量等气候要素为指相对湿度、降水量、蒸发量等气候要素为指标,根据样品的相
2、近程度,划分为若干种类标,根据样品的相近程度,划分为若干种类型,这称为型,这称为聚类分析;聚类分析;数量统计上,数量统计上,即分析即分析众多的样本众多的样本 划分确认来自几个不同的总体划分确认来自几个不同的总体。另外,气候分析中,类型分类已知,介另外,气候分析中,类型分类已知,介于两者之间的某站,则需根据两种类型(总于两者之间的某站,则需根据两种类型(总体)的特征和该站要素(样本)来判断该站体)的特征和该站要素(样本)来判断该站的属类;在天气预报中,有时需要根据前期的属类;在天气预报中,有时需要根据前期的样本观测值来判断哪种现象(晴,阴,雨)的样本观测值来判断哪种现象(晴,阴,雨)或现象等级(
3、火险等级或现象等级(火险等级1、2.5)将出现,则)将出现,则称为称为判别分析判别分析,也称为,也称为统计分辨法统计分辨法。判别分析与聚类分析均属数字分类。判别分析与聚类分析均属数字分类。3.1 费歇(费歇(Fisher)判别准则)判别准则与分析与分析一、一、Fisher判别准则判别准则 判别分析是已知有两个或更多的总体(类判别分析是已知有两个或更多的总体(类型),并且获得每个总体中的若干样本,根据型),并且获得每个总体中的若干样本,根据这些总体中的样本特征去建立一种判别规则,这些总体中的样本特征去建立一种判别规则,使我们能将某个使我们能将某个新的个体新的个体归属正确的归属正确的总体总体,而,
4、而事先并不知道该个体来自哪个总体。事先并不知道该个体来自哪个总体。若需要判别的对象有两种可能的结局,若需要判别的对象有两种可能的结局,则称为则称为二级判别二级判别;有两种以上可能结局,则;有两种以上可能结局,则称为多级判别。二级判别又称称为多级判别。二级判别又称简单判别简单判别。设设x x为与天气状况有关的变量,而天气状况为与天气状况有关的变量,而天气状况分为分为A A与与B B两种状况(晴,阴雨)两种状况(晴,阴雨),x,x的样本空间的样本空间由有利由有利A A的样本集合与有利的样本集合与有利B B的样本集合组成。的样本集合组成。SBRARmm)()()/()/(xBPxAP 越大时,判别效
5、果越好,错判率越低。越大时,判别效果越好,错判率越低。作为判别指标,作为判别指标,)()()/()/()/()/()()()()()/()/()()()/()/()()/()()/(xfAPBxfAxfxBPxAPBPAPBPxfBxfxBPAPxfAxfxAPAdxPAxfdxxfxAP ,有有当当同同理理根根据据概概率率乘乘法法定定理理有有)/()/(BxfAxf 而而取决于下列因素取决于下列因素BAmm )/()/(BxfAxf 1 1、指标、指标x x在两总体的期望值差异在两总体的期望值差异 越大,则越大,则越大,判别时,错判概率越小越大,判别时,错判概率越小2、x的离散程度越小,的离
6、散程度越小,x来自两不同总体的概率差来自两不同总体的概率差 越大。越大。)/()/(BxfAxf 综上所述,综上所述,离散程度小,期望值差异大,离散程度小,期望值差异大,表明两总体样本重叠部分少,表明两总体样本重叠部分少,x出现时事件出现时事件(类型)的出现概率差就大,以指标判别类(类型)的出现概率差就大,以指标判别类型时,错判率自然小,即两总体最大分离的型时,错判率自然小,即两总体最大分离的原则,这就是费歇判别准则原则,这就是费歇判别准则:希望用一个综合指标希望用一个综合指标y,它在两总体中方差它在两总体中方差最小,而条件期望值差异最大最小,而条件期望值差异最大。max)(minmax,)(
7、)()()(BxAxBABxAxBASSxxSSxx2 影响因子是复杂的,单个气象要素指标效果不佳影响因子是复杂的,单个气象要素指标效果不佳,可采用多个,可采用多个的要素线性组合成一个综合指标:的要素线性组合成一个综合指标:ppxcxcxcy 2211称为称为Fisher判别函数判别函数,iC称为判别系数。称为判别系数。利用历史资料,根据利用历史资料,根据Fisher准则,推断判别系准则,推断判别系数。数。以以2211xcxcy 为例,说明其几何意义为例,说明其几何意义212112211xcccyxxcxcycc/1、2两总体均存在较大重叠部分,若将样本两总体均存在较大重叠部分,若将样本投影到
8、直线投影到直线l上,则两总体重叠部分显著减少,上,则两总体重叠部分显著减少,能相对最大分离。能相对最大分离。在两总体的样本空间寻找一个最在两总体的样本空间寻找一个最佳投影方向,将样本在该方向投影佳投影方向,将样本在该方向投影后,两总体能够最大分离。后,两总体能够最大分离。二、线性二、线性Fisher判别方程的建立判别方程的建立设有设有A出现条件下,出现条件下,X1xm的的N1次观测值,次观测值,B出现条件下,出现条件下,X1xm的的N2次观测值次观测值构造判别方程构造判别方程按照按照Fisher准则,应有:准则,应有:mmxcxcy 11maxmax)()()(FEyyyyyyNiBBiNiA
9、AiBA2121122 kkkkkkcFcEFcFEcEFcmkc 10102,将BmmBBBmimBiBiAmmAAAmimAiAixcxcyxcxcyxcxcyxcxcy 11111111,代入代入mkddcdccExxddcdcxxcxxcyyEkmmkBkAkkmmBmAmmBABA121121121112 ,)()(,)()()()()()()()()()()()(kmmkBkBkiBmBmimBBiAkAkiAmAmimAAikBmBmimBNiBiNiAmAmimAAiwcwcxxxxcxxcxxxxcxxccFxxcxxcxxcxxcF111111112121112111222
10、 kkmmkmmkkkBkBkilBliAkAkiAlAliklBdddcdcwcwccFcExxxxxxxxw )()()(11111由由其其中中 B与标号与标号k无关,在方程组中是一个常数比例因子,仅无关,在方程组中是一个常数比例因子,仅起到使方程组同倍比放大或缩小的作用,不影响起到使方程组同倍比放大或缩小的作用,不影响Ck之间的之间的相对比例,因而不影响判别效果,故可令相对比例,因而不影响判别效果,故可令B=1。此时方程。此时方程组为:组为:mmmmmmmmmmdcwcwcwdcwcwcwdcwcwcw 22112222212111212111 求解方程组,解得判别系数,即可得求解方程组
11、,解得判别系数,即可得FIsher判别函数:判别函数:mmxcxcy 11DCW 建立判别函数后,可分别计算建立判别函数后,可分别计算A A、B B出现时,判别函出现时,判别函数数的平均值:的平均值:BjjBAjjAxcyxcy以它们的加权平均值以它们的加权平均值2121NNyNyNyBAc 作为判别事件作为判别事件A A或或B B 出现的临界值;出现的临界值;出出现现的的判判断断作作出出时时则则当当若若A,cBAyyyy 反之亦然。反之亦然。三、判别临界值的确定三、判别临界值的确定3.1)()(BAwww111111 klw)()(BAwww121212 )()(BAwww131313 )(
12、)(BAwww222222 )()(BAwww232323 )()(BAwww333333 100343395528631026001550028686859713960163125971333065321321321.ccccccccc解得解得078100498053320321.ccc四、判别效果的显著性检验四、判别效果的显著性检验 在多因子判别中,要选择若干分辨能力强在多因子判别中,要选择若干分辨能力强的变量组成判别函数,判别分析的基础是假的变量组成判别函数,判别分析的基础是假设两组样品取自不同的总体,如果两组多元设两组样品取自不同的总体,如果两组多元变量在统计上差异不显著,判别就没有价
展开阅读全文