模式识别第9章核方法概要课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《模式识别第9章核方法概要课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 方法 概要 课件
- 资源描述:
-
1、第9章 模式识别中的核方法9 模式识别中的核方法 9.1核方法概述核方法概述 9.2核方法基础 9.3凸优化与SVM9.1核方法概述 模式识别的核方法:首先把数据嵌入到合适的特征空间 然后采用基于线性代数、几何、统计学算法,发现嵌入数据的模式9.1核方法概述 核方法的4个关键:数据嵌入特征空间 在特征空间中寻找线性模式 在嵌入空间中,不需要计算点的坐标,只用两两内积 利用核函数,可以直接从初始数据高效地计算内积。从基于线性函数类的模式中抽取出来的模式函数数据 核函数 核矩阵 PA算法 模式函数9.1核方法概述线性回归 给定n维空间中训练集合 ,寻找齐次线性函数 使其为 S 的最优插值11(,)
2、,(,)Syyxx1(),ntiiigw xxw xw xiyixi(),gyxw x通过给定的n维点,拟合一个超平面yXw22(,)()()tLSwyXwyXw(,)220ttLS wX yX XwwttX XwX y如果 可逆tX X1()ttwX XX y令 11(,),(,)tttllyyXxxy9.1核方法概述线性回归 给定n维空间中训练集合 ,寻找齐次线性函数 使其为 S 的最优插值11(,),(,)S x yx y1(),ntiiigw xxw xw xiyixi如果 可逆tX X1()ttwX XX y2()()ttttwX X X XX yX1=iiix训练点的线性组合如果
3、不可逆:伪逆岭回归tX X9.1核方法概述岭回归如果 不可逆:数据不够,或存在噪声tX X没有足够信息,精确指明解法(不适定ill-posed)添加某种条件(或偏置),限制函数的选择(正则化)222(,)LSww选择范数较小的w范数与损失之间的相对权衡(,)2220ttLS wX yX XwwwttnX XIwX yIn 是一个 n 阶单位阵,时总可逆01ttnwX XIX y1(),ttngxw xy X X XIx9.1核方法概述对偶岭回归(,)2220ttLS wX yX Xwww1()twX yXwt X 训练点的线性组合1()yXw()yXw()tyXX 1()tXXIy,ti ji
4、jGXX Gx x称为Gram 矩阵1(),iiigxw xx x1(),tgx kyGIk11,iiiiiikx x:对偶变量,iik x xG:训练点对间的内积k:训练点和测试点之间的内积直接法:N 很大时,解N N 的方程组代价过大9.1核方法概述核函数:()nNFxx 考虑一个嵌入映射将 上的非线性关系转化为 高维空间上的线性关系nx(,)()(),fyygyw xxxN1()ttwX XX y对偶法:需要的所有信息为特征空间 F 中的内积,(),()i jijGxx(),()iikxx跳过显式计算 直接计算()ix(),()ixx核函数:(,)(),()x zxz核(kernel)是
5、一个函数 ,对于所有 满足:(,),Xx z其中 是从 X 到(内积)特征空间 F 的一个映射::()Fxx指数维,甚至无限维特征空间。那么,F中的线性函数为:9.1核方法概述核函数举例223121212:(,)()(,2)x xxxx xFxx考虑一个二维输入空间 同时考虑特征映射:2X 2211 122 11212()2gw xw xwx xx将特征空间中的线性关系与输入空间中的二次关系相对应:22221212121 2(,)(),()(,2),(,2)xxx xzzz zx zxz222222112112 1 21 1222,x zx zx x z zx zx zx z直接计算特征空间中
6、的内积不用显式计算特征空间中的坐标2241212122 1:(,)()(,)x xxxx x x xFxx2(,),x zx z也可计算如下映射空间的内积特征空间并不由核函数唯一确定9.1核方法概述核函数举例312,1:(,)()()niji jx xx xFxx考虑一个 n 维输入空间 ,那么函数是一个核函数,对应的特征映射为:nX,1,1(),()(),()nniji jiji jzx xz zx2(,),x zx z2,111,nnnijijiijji jijx x z zx zx zx z因为:9 模式识别中的核方法 9.1核方法概述 9.2核方法基础核方法基础 9.3凸优化与SVM核
7、矩阵 考虑 l 个训练样本在 N 维特征空间中映射,记为 l N 矩阵1(),()tlXxx称与之相关的L L Gram矩阵为核矩阵,其元素为tKXX(),()(,)ijijijKxxx x核矩阵可写作:基本运算 如果 是核,B是一个半正定矩阵,p(x)是一个正系数多项式,那么下面都是核:12,12112(,)(,)(,)(,)(,)(,)(,)(,)(,)tBx zx zx zx zx zx zx zx zx zxx1122(,)(,)(,)exp(,)(,)exp,2px zx zx zx zx zx z高斯核均值和距离特征向量的范数:2()(),()(,)xxxx x特征向量的规范化:(
8、)()()xxx()()(,)(),(),()()xzx zxzxz(),()(,)()()(,)(,)xzx zxzx xz z均值和距离特征向量线性组合的范数:2111()(),()iiiijjiij xxx11(),()ijijij xx,1(,)ijiji j x x均值和距离特征向量之间的距离:2()()()(),()()xzxzxz(),()2(),()(),()xxxzzz(,)2(,)(,)x xx zz z均值和距离质心的范数11()siix21111(),()sijijxx22,1,111(),()(,)ijiji ji jxxx x质心的范数的平方=核矩阵元素的平均值均值
9、和距离点到质心的距离11()siix2()(),(),2(),ssss xxxx2,1112(,)(,)(,)ijji jix xx xx x均值和距离方差221,1,1112(,)(,)(,)kkijikki ji kx xx xx x211()isix21,111(,)(,)kkijki jx xx x核矩阵对角线元素平均值-全体元素平均值中心化数据把原点移到质心平均特征值最小化211,1111(,)(,)(,)(,)ijijiji jx zx xx zx x移动后,新的核函数为1111(,)(),()()(),()()iiiix zxzxxzx11()()()()siixxxx可以证明对
10、于 有:中心化的稳定性 从训练样本估计质心的可靠性:样本中心多大程度上接近真实期望?()()()XdPExxxx()()sg SExx221()2lnRg S11()iisx在概率 下:新颖检测举例11()()maxidEdxxx1x对于一个新的随机点 满足 11)()SSEdxxxmaxid(1)s21()212lnSRx1x概率的界:11max1iP ddl2121()()max()2lnSiSiRfH xxx()1(1)E fxx模式函数的期望在概率 下的界为:(1)把满足 的项视为新颖项,把正常项误判为正常项的概率最大为()1fx1(1)二分类举例将训练集S 划分为两个正例、负例子集:
11、S_,S+利用新颖检测,计算测试点 x 到两子集质心的距离:()()Sdxx()()Sdxx分类规则为:22()sgn()()SShxxx2,1112sgn(,)(,)(,)ijii jix xx xx x2,1112(,)(,)(,)ijii jix xx xx x1111sgn(,)(,)iiiibx xx xb+b-数据分散度标准化数据两均值为0的随机变量 x,y 的协方差:两变量乘积的期望cov(,)xyx yExy不同原始特征,难以直接比较,需要在比较前进行标准化:xxxx两变量的相关性:corr(,)xyxyx yExyxyxyxyxyE 以下三条件等价:1xyxyywxb比较两变
展开阅读全文