SVM分类与回归简介ppt课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《SVM分类与回归简介ppt课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SVM 分类 回归 简介 ppt 课件
- 资源描述:
-
1、1支持向量回归机松弛变量、核函数与特征映射支持向量机-线性分类器机器学习问题简介3 31 12 23 34 4总结5 52什么是机器学习?机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核 心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。Alpaydin(2004)同时提出自己对机器学习的定义,“机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。一个有趣的例子3机器学习就是从给定的函数集f(x x,)(是参数)中,选择出能够最好地逼近训练器响应的函数
2、。机器学习的目的可以形式化地表示为:根据n个独立同分布的观测样本 ,在一组函数 中求出一个最优函数 对训练器的响应进行估计,使期望风险最小 其中 是未知的,对于不同类型的机器学习问题有不同形式的损失函数。 1122( ,),(,),(,)nnx yxyxy ( , )f x0 ( , )f x( )( , ( , )( , )RL y f xdP x y( , )P x y4模式识别令训练器的输出y只有两种取值 ,并令 为指示函数集合(指示函数只有0和1两种取值),考虑下面的损失函数:我们把指示函数给出的答案与训练器输出不同的情况叫做分类错误,这样学习问题就变成了寻找使损失函数最小的问题。1
3、, 0y( , ),f x a a0( , )( ,( , )1( , )yf x aL y f x ayf x a若若5回归估计令训练器的输出y为实数值,并令为实数集,回归函数就是在损失函数最小化的函数估计密度估计密度估计就是从密度函数集中估计密度函数的问题( , ),f x a a2( ,( , )( , )L y f x ayf x a6支持向量机(Support Vector Machine, SVM)1963年,Vapnik在解决模式识别问题时提出了支持向量方法,这种方法从训练集中选择一组特征子集,使得对特征子集的划分等价于对整个数据集的划分,这组特征子集就被称为支持向量(SV)。1
4、971年,Kimeldorf提出使用线性不等约束重新构造SV的核空间,解决了一部分线性不可分问题。1990年,Grace,Boser和Vapnik等人开始对SVM进行研究。1995年,Vapnik正式提出统计学习理论。7SVM从线性可分情况下的最优分类面发展而来。最优分类面就是要求分类线不但能将两类正确分开(训练错误率为0),且使分类间隔最大。SVM考虑寻找一个满足分类要求的超平面,并且使训练集中的点距离分类面尽可能的远,也就是寻找一个分类面使它两侧的空白区域(margin)最大。8+1-1如何进行数据分类(x,)()f,sign.bw bw x9+1-1(x,)()f,sign.bw bw
5、x如何进行数据分类10+1-1(x,)()f,sign.bw bw x如何进行数据分类11+1-1(x,)()f,sign.bw bw x如何进行数据分类12+1-1如何选择最优分类面?13+1-1线性分类器的间隔( margin):到超平面最近的样本与此超平面之间的距离。(x,)()f,sign.bw bw x14+1-1具有最大间隔的线性分类器叫做最大间隔线性分类器。其就是一种最简单的支持向量机(SVM) (称为线性支持向量机,即LSVM)(x,)()f,sign.bw bw x15+1-1支持向量(Support Vectors) :是那些距离超平面最近的点。具有最大间隔的线性分类器叫做
6、最大间隔线性分类器。其就是一种最简单的支持向量机(SVM) (称为线性支持向量机,即LSVM)16+1-1f f(x x,w w,b) = sign(w w. x. x - b)支持向量(Support Vectors) :是那些距离超平面最近的点。具有最大间隔的线性分类器叫做最大间隔线性分类器。其就是一种最简单的支持向量机(SVM) (称为线性支持向量机,即LSVM)1.直观上感觉很好. 2.学习得到的线性分类器.其对未知样本的预测能力与分类器间隔有如下关系:)arg1()()(inmRRemp17()1,1,.,iiyw xbil假定训练数据可以被一个超平面分开我们进行正归化此时分类间隔等
7、于使最大间隔最大等价于使 最小RbRwbxwN, 0).(11( ,),.,( ,), 1, 1nllx yx yxR y 2w2w18最优分类面问题可以表示成约束优化问题 Minimize Subject to定义Lagrange函数211( )()22()1,1,.,iiwww wyw xbilliiiibwxywbwL1221) 1)(),(19liiiibwxywbwL1221) 1)(),(Lagrange函数令其偏导数为0得到( , , )0 ,( , , )0L w bL w bbwiiliiiliixywya11020因此该问题的求解可转化为一个标准的二次优化问题,通过对该问题
8、的求解即可完成支持向量的求解12,11111*:1:1min: ( )().0,1,., ,0( )sgn()maxmin2iillijijijii jiliiiiliiiiliiiiTTi yii yiJy yx xstilandyf xyx xbwy xw xw xb 目标函数:决策函数:21以上所得到的最优分类函数为:该式只包含待分类样本与训练样本中的支持向量的内积 运算,要解决一个特征空间中的最优线性分类问题,我们只需要知道这个空间中的内积运算即可。若存在离群点,则问题变成了线性不可分?*1( )sgnsgn()liiiif xwxby x xb 22线性不可分的情况下,可以条件中增加
展开阅读全文