书签 分享 收藏 举报 版权申诉 / 83
上传文档赚钱

类型第六章判别分析方案.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:5193714
  • 上传时间:2023-02-16
  • 格式:PPT
  • 页数:83
  • 大小:1.48MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第六章判别分析方案.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第六 判别分析 方案
    资源描述:

    1、第六章第六章 判别分析判别分析discriminant analysis 判别分析的基本概念判别分析的基本概念 两总体判别分析两总体判别分析 多总体判别分析多总体判别分析 SPSS的判别分析过程的判别分析过程 一、判别分析的基本概念一、判别分析的基本概念 判别分析问题的描述:判别分析问题的描述:已知若干组分类数据已知若干组分类数据 现有一新样本,要求判定新样本数据属于已知分类现有一新样本,要求判定新样本数据属于已知分类中的哪一类中的哪一类 判别分析的关键:判别分析的关键:判别函数:由描述各类的数值指标构成的分类规则,判别函数:由描述各类的数值指标构成的分类规则,明确已知各类应如何区别明确已知各

    2、类应如何区别 例:肝炎病人的诊断例:肝炎病人的诊断 两总体判别:肝炎病人和正常人两总体判别:肝炎病人和正常人 判别依据:一些化验指标,形成判别公式判别依据:一些化验指标,形成判别公式-判别函数判别函数Simple,Two-Group DAMean of group 1 from data you haveMean of group 2 from data you haveUnknown observationx如何判别:如何判别:x与哪类距离近,与哪类距离近,就归属于哪类:就归属于哪类:若若dx1dx2,则则x属于第属于第2类类判别函数:判别函数:f=dx1-dx20,x2,0,x1判别规则判

    3、别规则中国属于发展中国家还是发达国家?Pattern Recognition Problem判别分析与方差分析、聚类分析判别分析与方差分析、聚类分析 先采用聚类分析获得各个个体的类别(classification);然后采用判别分析建立判别函数,对新个体进行类型识别(identification)k判别分析的方法与数学描述判别分析的方法与数学描述 数据描述数据描述 对于对于m类总体类总体G1,G2,Gm,其分布函,其分布函数分别为数分别为f1(y),f2(y),fm(y),对于一个给,对于一个给定样品定样品y,我们要判断出这个样本来自哪个总,我们要判断出这个样本来自哪个总体。判别分析的主要问题

    4、就是如何寻找体。判别分析的主要问题就是如何寻找最佳最佳的的判别函数和建立判别规则。判别函数和建立判别规则。误判问题误判问题 肝功指标高就一定是肝炎病人吗?肝功指标高就一定是肝炎病人吗?误判率误判率Misclassification(1-D case)两总体单指标的判别分析,假设正态分布,等方差判别规则转氨酶肝炎肝炎患者患者非患者非患者非典?非典??Best-In What Sense?Minimizes probability of misclassification Maximizes posterior probability of correct classification Many

    5、others For example minimizes the cost of misclassification 具体问题具体分析具体问题具体分析 疾病的诊断疾病的诊断 市场分析市场分析Lots of perspectives suggest this basic rule as best影响误判率的因素影响误判率的因素当分布中心过于接近,误判率很高三总体单指标组均值差异组均值差异Three groups-Two features二、两总体判别分析二、两总体判别分析 基本思想:样品和哪个总体距离最近,就判断它属基本思想:样品和哪个总体距离最近,就判断它属于那个总体。于那个总体。设:两个总体

    6、设:两个总体G1和和G2,x是一个是一个p维样本,维样本,x到总体到总体G1和和G2的的马氏距离马氏距离分别记为分别记为d2(x,G1)和和d2(x,G2),判别规则:若判别规则:若d2(x,G1)d2(x,G2),认为认为x属于属于G2。或判别函数:或判别函数:W(x)=d2(x,G2)-d2(x,G1)0,x G10,x G2 当当W(x)001G1G2考察考察p=1的情况的情况21221G0G0)5.0()(W110 xxxx,则:,若 设设G1N(1,2)和和G2N(2,2),判别函数为:,判别函数为:21G0.5G0.50.50,)(Wxxxxxx解出或:令)(12)()(1)2()

    7、(W2122121221axaxx,其中x=0.5误判率P(2/1)=0.3085误判率P(1/2)=?12时,非线性判别函数时,非线性判别函数)()()()()G,()G,()(W)()()G,()()()G,(111121221222212222111112xxxxxxxxxxxxxdddd判别函数判别函数W(x)为为x的二次函数的二次函数直观判断直观判断x0属于哪属于哪一类?一类?G1:N(80,0.25)G2:N(75,4)21227580 x0=78 已知已知G1是设备是设备A生产的产品,生产的产品,G2是设备是设备B生产的产品。生产的产品。A设备质量高,其产品平均耐磨度设备质量高,

    8、其产品平均耐磨度 1=80,方差,方差 12=0.25,B设备质量较差,其产品平均耐磨度设备质量较差,其产品平均耐磨度 2=75,方差,方差 22=4。现有一产品现有一产品X0,其耐磨度,其耐磨度x0=78,试判断该产品是哪台,试判断该产品是哪台设备生产的。建立判别规则,误判率多大?设备生产的。建立判别规则,误判率多大?考察考察p=1的情况的情况直观上看,x0距1较近,但是考虑到相对分散度,20102202222220202221210102Gx:)G,x(d)G,x(d25.24)7578()x()G,x(d1625.0)8078()x()G,x(d2122112122xxxx,Gxxxx,

    9、Gx81.7x79,x025.0)80 x(4)75x(W(x)或当当判别函数判别准则x1x22.Fisher 判别法判别法 判别思想:投影,使多维问题简化为一维判别思想:投影,使多维问题简化为一维问题来处理问题来处理 方法:寻找原变量方法:寻找原变量x的一个线性组合,使得的一个线性组合,使得各组在此方向上投影的差异最大化,再选各组在此方向上投影的差异最大化,再选择合适的判别规则对样品进行分类判别。择合适的判别规则对样品进行分类判别。Fishers approachFind a linear combination of variables x that would produce“maxim

    10、ally different”discriminant scores across group数学模型数学模型 设:线性组合的系数向量为设:线性组合的系数向量为a,考虑线性考虑线性组合:组合:z=xaz:x在在a方向的投影方向的投影 通过寻找合适的通过寻找合适的a,使投影到此方向的组,使投影到此方向的组间变异大,组内变异比较小,即使组间间变异大,组内变异比较小,即使组间变异变异/组内变异(离差平方和)取最大值。组内变异(离差平方和)取最大值。两总体两总体Fisher判别函数判别函数 设:两协差阵相等的总体设:两协差阵相等的总体G1:n1个样本,个样本,G2:n2,1,2和和 分别表示两总体均值

    11、和总均值分别表示两总体均值和总均值 线性组合的系数向量为线性组合的系数向量为a,考虑线性组合:考虑线性组合:z=xa 投影后的组内变异:组内离差平方和为投影后的组内变异:组内离差平方和为aaaaaaaawiiiiiiiiiiiiiiiiwSSxxxxxxxxzzzzSS )()()()()()()()(2)2(2)2(1)1(1)1(2)2(2)2(1)1(1)1(2)2()2(2)1()1(投影后的组间变异:组间离差平方和为投影后的组间变异:组间离差平方和为addadaddddaauuauua1211)()()()()()()(221222211122212)2(22)1(1AASSnnnn

    12、nnnnnnzznzznSS)(dadaddaaddaaa)(aa)a)(adda)dda)(aaaaaddaa121112aLLLLLFisher有:都是标量,和,得到:两边乘取得最大值使得选择1102/022:以上证明,当以上证明,当a-1(2-1)时满足我们的时满足我们的要求,即:判别投影方向要求,即:判别投影方向在两类均值点在两类均值点的连线上的连线上。通常我们将。通常我们将a标准化。标准化。判别函数为:判别函数为:z=x-1(2-1)判别规则:判别规则:zc时,时,xG2;zc时,时,xG1,2/)(21zzcLinear Discriminatorscritical value投影

    13、方向判别函数判别得分c2c1,xG1c30.43buyer0.141.9,33.073.1221SPSS输出输出结果结果判别规则:zc=(1.018-0.0922)/2=0.4629buyer判别函数:判别函数:artnummonthz412.1105.0086.0规范判别式函数系数规范判别式函数系数-.0511.412.086monthartnum(常量)1函数非标准化系数组质心处的函数组质心处的函数-.0921.018buystatu011函数在组均值处评估的非标准化规范判别式函数判别变量和标准化判别判别变量和标准化判别函数的相关系数函数的相关系数购买艺术书越多的顾客越可能购买,越近期的顾

    14、客越可能购买结构矩阵结构矩阵.914-.376artnummonth1函数判别变量和标准化规范判别式函数之间的汇聚组间相关性按函数内相关性的绝对大小排序的变量。标准化的规范判别式函数系数标准化的规范判别式函数系数-.405.927monthartnum1函数判别得分的分布判别得分的分布6.506.005.505.004.504.003.503.002.502.001.501.00.500.00-.50-1.00-1.50Canonical Discriminant Function 1BUYSTATU=05004003002001000Std.Dev=.93 Mean=-.09N=917.00

    15、5.505.004.504.003.503.002.502.001.501.00.500.00-.50-1.00-1.50Canonical Discriminant Function 1BUYSTATU=15004003002001000Std.Dev=1.56 Mean=1.02N=83.00Non-buyersbuyersz=0z=0分类结果分类结果a a70221591735488376.623.4100.042.257.8100.0buystatu0101计数%初始01预测组成员合计已对初始分组案例中的 75.0%个进行了正确分类。a.回判结果回判结果误判率误判率25%发出263封订

    16、购信,约18.3%会订购协方差阵相等的检验协方差阵相等的检验-Boxs test H0:1=2=m 协方差不等时的判别:非线性判别函数协方差不等时的判别:非线性判别函数 如果仍用线性判别,误判率增大如果仍用线性判别,误判率增大组内协方差相等时G1G2G22221Books by mailClassification Resultsa70221591735488376.623.4100.042.257.8100.0BUYSTATU0101Count%Original01Predicted GroupMembershipTotal75.0%of original grouped cases cor

    17、rectly classified.a.协方差相等算法的误判率协方差不等算法的误判率发出263封订购信,约18.3%会订购发出197封订购信,约20.3%会订购检验结果检验结果77.80925.7063243266.71.000箱的 M近似。df1df2Sig.F对相等总体协方差矩阵的零假设进行检验。分类结果分类结果a a76015791743408382.917.1100.051.848.2100.0buystatu0101计数%初始01预测组成员合计已对初始分组案例中的 80.0%个进行了正确分类。a.判别函数的鉴别能力判别函数的鉴别能力类中心差异的显著检验类中心差异的显著检验Wilkss

    18、 test 为什么要检验?为什么要检验?类中心距离太近时,误判率高。类中心距离太近时,误判率高。如果某个判别函数不能拒绝原假设,则这个如果某个判别函数不能拒绝原假设,则这个判别函数的判别能力很差判别函数的判别能力很差n 如何检验:该判别函数在各类中心相等 H0:1=2Wilks 的 LambdaWilks 的 Lambda.91489.6112.000函数检验1Wilks 的Lambda卡方dfSig.3.Bayesian approach 前面两种方法中都没有考虑各类中样本前面两种方法中都没有考虑各类中样本数的差异数的差异 没有考虑误判带来的不对称经济损失没有考虑误判带来的不对称经济损失 当

    19、各类样本数不同当各类样本数不同/误判损失不对称时,误判损失不对称时,是否会影响判别函数的选取或判别规则?是否会影响判别函数的选取或判别规则?Incorporating Prior Probs考虑先验概率R1的误判率高于R2考虑到各类样本容量不同对误判率的影响,判别规则应作适当调整考虑到各类样本容量不同对误判率的影响,判别规则应作适当调整3.Bayesian approach 贝叶斯的统计思想:假定对研究的对象已有贝叶斯的统计思想:假定对研究的对象已有一定的认识(常用先验概率反映这种认识),一定的认识(常用先验概率反映这种认识),然后抽取一个样本,用样本来修正已有的认然后抽取一个样本,用样本来修

    20、正已有的认识。识。影响分类的因素影响分类的因素 先验概率先验概率 用概率描述的人们事先对所研究对象的认识用概率描述的人们事先对所研究对象的认识 误判损失误判损失cost of misclassification:x被判为属于被判为属于G2,而它实际属于,而它实际属于G1,则称发生了误判,则称发生了误判 误判可能会带来经济损失误判可能会带来经济损失 当误判损失不对称时(比如当误判损失不对称时(比如G1样本误判为样本误判为G2的成本的成本是是G2样本误判为样本误判为G1的成本的的成本的10倍时),我们通常会倍时),我们通常会改变判别准则(使之偏向误判成本低的一方),宁可改变判别准则(使之偏向误判成

    21、本低的一方),宁可将将G2误判给误判给G1,也不愿相反。,也不愿相反。3.Bayesian approach 基本思路:误判期望损失最小化 设有m个总体G1,Gm,其概率密度函数分别为fi(x),i=1,2m。来自总体Gi的样品x被错判为总体Gj所产生的损失为C(j/i),那么,对于判别规则R产生的误判概率记为P(j/i,R),有:jRidxxfRijP)(),/(如果已知x来自总体Gi的先验概率为qi(i=1,2,m),则在规则R下,误判期望损失为:mjmiiRijPijCqRg11),/()/()(贝叶斯定理贝叶斯定理 若总体若总体G1,Gm的先验概率为的先验概率为qi,且相应的密,且相应

    22、的密度函数为度函数为fi(x),损失是,损失是C(j/i)时,则划分时,则划分R的的贝叶斯解为:贝叶斯解为:miiijjkKxfijCqhmkhhR1)()/()(,1),(min)(|xxxx其中当抽取了一个未知总体的样品值x(p维向量),要判断它属于哪个总体,只要先计算出个按先验分布加权的误判平均损失hj(x),然后比较这m个平均损失的大小,取其中最小的,则判定x来自该总体两总体判别两总体判别 设有设有2个总体,其先验概率分别为个总体,其先验概率分别为q1,q2,满足:,满足:qi0,qi=1,误判成本分别为,误判成本分别为C(1/2),C(2/1),h1(x)=q2f2(x)C(1/2)

    23、,h2(x)=q1f1(x)C(2/1),R1=x|q2f2(x)C(1/2)q1f1(x)C(2/1)1/2()2/1()(,)1/2()2/1()(,)()()(V,)1/2()()2/1()()()(12212121112221CqCqxVGxCqCqxVGxxfxfxCxfqCxfqxhxh若若则判别规则为:若令判别函数为:两总体判别两总体判别)2/1()1/2(ln)2/1()1/2(ln2121CqCqczorcCqCqcz其中:z-Fisher判别函数得分,c-两个类中心连线的中点(Fisher判别准则)当先验概率和误判损失各类都相等时,即为当先验概率和误判损失各类都相等时,即为

    24、Fisher判别。先验概率判别。先验概率/误判损失不对称时,相当于对原判别值做一个修正误判损失不对称时,相当于对原判别值做一个修正 如果如果f f1 1(x)(x)与与f f2 2(x)(x)分别为分别为N Np p(1 1,),)和和N Np p(2 2,),),则,则)(exp)(exp)(2exp)()(21)()(21exp)()()(2112121211121xzcxWxxxxxxfxfxV)()(21exp)2(1)(12/12/iipixxxf练习题练习题 考虑下列判别分析问题:随机抽取考虑下列判别分析问题:随机抽取60个个样本,相关统计资料如下:样本,相关统计资料如下:45.1

    25、91.091.082.1),0.0,5.0(),0.0,5.0(,40,201)2()1(21xxnn一个新的样本为一个新的样本为x=(0.0,0.5)x=(0.0,0.5),问,问x x属于(属于(1 1)类还)类还是(是(2 2)类。)类。Books by mail 1000个样本顾客中,个样本顾客中,buyer只有只有83人,其人,其他他917名都是名都是non-buyer,先验概率相差很先验概率相差很大。做先验概率修正后,分类结果:大。做先验概率修正后,分类结果:修正后(修正后(Bayers法)法)发出197封订购信,约20.3%会订购发出44封订购信,约43.2%会订购修正前修正前分

    26、类结果分类结果a a76015791743408382.917.1100.051.848.2100.0buystatu0101计数%初始01预测组成员合计已对初始分组案例中的 80.0%个进行了正确分类。a.分类结果分类结果a a8922591764198397.32.7100.077.122.9100.0buystatu0101计数%初始01预测组成员合计已对初始分组案例中的 91.1%个进行了正确分类。a.分类结果分类结果a a79112691749348386.313.7100.059.041.0100.0buystatu0101计数%初始01预测组成员合计已对初始分组案例中的 82.5

    27、%个进行了正确分类。a.误判损失误判损失修正修正此例为典型非对称误判损失:非买者误判为买者,损失较小(邮资费、资料费、人工费),设为1元;买者误判为非买者损失较大,为一本书的净利润,设为6元发出160封订购信,约21.3%会订购:准确率下降!净利润=634-1126=78净利润=611-110=5684.1)2/1()1/2(,11qq)2/1()1/2(ln212121CqCqCqCqcz本例:注意:误判损失修正需注意:误判损失修正需用用syntaxsyntax语句编程,人语句编程,人工输入先验概率(工输入先验概率(0.648)0.648)仅先验概率修正分类结果分类结果a a90710917

    28、72118398.91.1100.086.713.3100.0buystatu0101计数%初始01预测组成员合计已对初始分组案例中的 91.8%个进行了正确分类。a.3 Groups in 2 Dimensions三、多总体判别分析Partitioning 2-D SpaceAlternate ViewLikelihood ViewNon-Linear Discriminators两个判别变量、三类四、SPSS的Discriminant过程 Discriminant过程的大部分功能都可以通过对话框来指定,还有一些功能可以在Syntax页中给予补充或修改。例如,;显示旋转方式和结构矩阵;限制提

    29、取的判别函数的数目;读取一个相关矩阵;分析后把相关矩阵写入文件;指定对参与分析的观测量进行回代分类,对没有参与分析的观测量进行预测分类等。SPSSSPSS的判别分析方法的判别分析方法 为研究舒张期血压和血浆胆固醇对冠心病的作用,某医院测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如下,试作判别分析,建立判别函数以便在临床中用于筛选冠心病人。判别分析判别分析数据结构数据结构设一分组变量表示分组类别判别分析过程判别分析过程 分析分类 判别.,弹出判别分析对话框。定义分组变量取值范围SPSS提供6种方法进行判别函数分析:强迫变量进入法及其他5种逐步进入法强迫进入法:已选变量

    30、全部进入模型逐步进入法选择满足指定条件的样本进行分析定义分组变量取值范围定义分组变量取值范围分组变量最大值分组变量最小值逐步进入方法选择对话框逐步进入方法选择对话框“组间最小F比率”值最大的变量具有最小总体Wilks 值的变量进入模型具有最小未被解释的组间方差的变量具有近邻组间最大马式距离的变量具有最大Raos V增量的变量显示每步每个变量的统计量显示两两类间的F统计量逐步判别停止判据根据F值:Fentry值保留,F0的为冠心病人,判别分的为冠心病人,判别分0的的为正常人。为正常人。规规 范范 判判 别别 式式 函函 数数 系系 数数.638.800-10.753舒张压胆固醇(常量)1函数非标

    31、准化系数组质心处的函数组质心处的函数1.112-1.042group121函数在组均值处评估的非标准化规范判别式函数分类结果分类结果a a123153131680.020.0100.018.881.3100.0group1212计数%初始12预测组成员合计已对初始分组案例中的 80.6%个进行了正确分类。a.2.502.001.501.00.500.00-.50Canonical Discriminant Function 1GROUP=13.53.02.52.01.51.0.50.0Std.Dev=1.06 Mean=1.11N=15.001.00.500.00-.50-1.00-1.50-

    32、2.00-2.50Canonical Discriminant Function 1GROUP=2543210Std.Dev=.94 Mean=-1.04N=16.00例:例:mba-car-preferrence 前一章前一章MBA汽车偏好例汽车偏好例 先用快速聚类将偏好数据分为先用快速聚类将偏好数据分为3类类 再用判别分析建立判别函数再用判别分析建立判别函数首先进行方差检验,以确定判别方法再进行相应的判别分析,给出误判率协方差相等假设下的判别结果协方差相等假设下的判别结果Canonical Discriminant FunctionsFunction 16420-2-4Function 2

    33、420-2-4Cluster Number of CaGroup CentroidsUngrouped Cases321321检验结果检验结果199.0981.62711043292.497.000箱的 M近似。df1df2Sig.F对相等总体协方差矩阵的零假设进行检验。Wilks 的 LambdaWilks 的 Lambda.151271.39920.000.440117.7389.000函数检验1 到 22Wilks 的Lambda卡方dfSig.分类结果分类结果a a54115603523710575896.41.81.8100.0.094.65.4100.01.7.098.3100.0

    34、案例的类别号123123计数%初始123预测组成员合计已对初始分组案例中的 96.7%个进行了正确分类。a.Territorial PlotCanonical Discriminant FunctionsFunction 16420-2-4Function 2420-2-4Cluster Number of CaGroup CentroidsUngrouped Cases321321Territorial PlotCanonical Discriminant FunctionsFunction 16420-2-4Function 2420-2-4Cluster Number of CaGrou

    35、p CentroidsUngrouped Cases321321Draw in perpendicular bisectorsTerritorial PlotCanonical Discriminant FunctionsFunction 16420-2-4Function 2420-2-4Cluster Number of CaGroup CentroidsUngrouped Cases321321This is“closest mean”classification.用方差不等方法的用方差不等方法的判别结果判别结果Territorial Plot显示的分界为非线性分类结果分类结果a a54

    36、115603613720565896.41.81.8100.0.097.32.7100.03.4.096.6100.0案例的类别号123123计数%初始123预测组成员合计已对初始分组案例中的 96.7%个进行了正确分类。a.分类结果分类结果a a54115603523710575896.41.81.8100.0.094.65.4100.01.7.098.3100.0案例的类别号123123计数%初始123预测组成员合计已对初始分组案例中的 96.7%个进行了正确分类。a.将数据快速聚为将数据快速聚为4类后类后判别分析判别分析 方差相等方差相等 方差不等方差不等 先验概率先验概率 交叉检验交叉

    37、检验通信公司通信公司客户细分客户细分 某通信公司以服务项目将客户分为以下四类:某通信公司以服务项目将客户分为以下四类:basic service,e-service,plus service,total service 依据下述变量进行判别:依据下述变量进行判别:Age in Years,Marital status,Household income in thousands,Years at current address,Retired,and Gender,Number of people in household,Level of education,Years with curren

    38、t employerBoxs Test test检验结果检验结果581.5794.2391352030661.6.000箱的 M近似。df1df2Sig.F对相等总体协方差矩阵的零假设进行检验。结构矩阵结构矩阵.953*-.135.026-.167.897*.122-.039.629*-.502-.128.582*-.140.124.519*.406.176.274*-.070-.163.244*.171.228.064.330*.035.004-.283*Level of educationYears with currentemployerYears at currentaddressAg

    39、e in yearsHousehold incomein thousandsMarital statusRetiredNumber of peoplein householdGender123函数W Wi il lk ks s 的的 L La am mb bd da a.779248.37827.000.93665.23716.000.98910.7707.149函数检验1 到 32 到 33Wilks 的Lambda卡方dfSig.不考虑不考虑异方差异方差分类结果分类结果a a1282457572665132528221788321164528143353012823648.19.021.4

    40、21.4100.023.514.724.037.8100.031.311.441.316.0100.018.214.812.754.2100.0Customer categoryBasic serviceE-servicePlus serviceTotal serviceBasic serviceE-servicePlus serviceTotal service计数%初始Basic serviceE-servicePlus service Total service预测组成员合计已对初始分组案例中的 40.4%个进行了正确分类。a.-3-2-10123Function 1Function 1

    41、-2-1012345Function 2Function 2Basic serviceE-servicePlus serviceTotal serviceCustomer categoryBasic serviceE-servicePlus serviceTotal serviceGroup CentroidCanonical Discriminant FunctionsCanonical Discriminant Functions本章小结本章小结 判别分析:已知判别分析:已知m类总体,对于一个给定样品类总体,对于一个给定样品y,判断来自哪个总体。判断来自哪个总体。主要问题:寻找主要问题:寻

    42、找最佳最佳的判别函数和建立判别规则的判别函数和建立判别规则 马氏等距离法马氏等距离法 样本点到哪个类中心的马氏距离最近就归属于哪一类样本点到哪个类中心的马氏距离最近就归属于哪一类 Fisher方法方法 以类中心连线为投影方向(类间距离最大)建立判别以类中心连线为投影方向(类间距离最大)建立判别函数函数 Bayesian方法方法 先验概率和不对称误判成本修正先验概率和不对称误判成本修正本章小结本章小结-续续 判别分析之检验判别分析之检验 类协方差相等的检验:类协方差相等的检验:Boxs test类方差相等:判别函数为线性函数,类分界线为直线类方差不等:非线性函数,类分界线为曲线 类均值相等的检验:类均值相等的检验:Wilkss test 判别函数个数:分类数判别函数个数:分类数-1人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第六章判别分析方案.ppt
    链接地址:https://www.163wenku.com/p-5193714.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库