机器学习-课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《机器学习-课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 课件
- 资源描述:
-
1、1ppt课件是寻找一种对自然/人工主题、现象或活动可预测且/或可执行的机器理解方法2ppt课件研究计算机怎样模拟模拟或实现实现人类(动物动物)的学习行为,以获取新的知识或技能重新组织已有的知识结构使之不断改善自身的性能是人工智能的核心,是使计算机具有智能的根本途径其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎3ppt课件4ppt课件 必须预先知道学习的期望结果,并依此按照某一学习规则来修正权值。知道输入数据,知道结果,用函数预测个例无监督学习,不知道结果,根据数据特征分类 是监督学习与无监督学习相结合的一种学习方法。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类
2、的问题。输入数据不可靠,依据权重的调整进行训练。利用某一表示“奖惩”的全局信号,衡量与强化输入相关的局部决策如何。(输入输出之间没有固定的函数)5ppt课件决策树(简单问题)人工神经网络(大量样本)支持向量机(小样本)6ppt课件7ppt课件 决策树学习决策树学习1 1什么是决策树什么是决策树决策树(decision tree)也称判定树,它是由对象的若干属性、属性值和有关决策组成的一棵树。其中的节点为属性(一般为语言变量),分枝为相应的属性值(一般为语言值)。从同一节点出发的各个分枝之间是逻辑“或”关系;根节点为对象的某一个属性;从根节点到每一个叶子节点的所有节点和边,按顺序串连成一条分枝路
3、径,位于同一条分枝路径上的各个“属性-值”对之间是逻辑“与”关系,叶子节点为这个与关系的对应结果,即决策。例如图1就是一棵决策树。其中,A,B,C代表属性,ai,bj,ck代表属性值,dl代表对应的决策。处于同一层的属性(如图中的B,C)可能相同,也可能不相同,所有叶子节点(如图中的dl,l=1,2,6)所表示的决策中也可能有相同者。8ppt课件由图1不难看出,一棵决策树上从根节点到每一个叶子节点的分枝路径上的诸“属性-值”对和对应叶子节点的决策,刚好就构成一个产生式规则:诸“属性-值”对的合取构成规则的前提,叶子节点的决策就是规则的结论。例如,图1中从根节点A到叶子节点d2的这一条分枝路径就
4、构成规则:(A=a1)(B=b2)=d2而不同分枝路径所表示的规则之间为析取关系。9ppt课件图1 决策树示意图 10ppt课件图 2 飞机起飞的简单决策树 11ppt课件例例1 图3所示是一个描述“兔子”概念的决策树。图 3“兔子”概念的决策树 12ppt课件2.2.怎样学习怎样学习决策树决策树 决策树是一种知识表示形式,构造决策树可以由人来完成,但也可以由机器从一些实例中总结、归纳出来,即由机器学习而得。机器学习决策树也就是所机器学习决策树也就是所说的决策树学习说的决策树学习。决策树学习是一种归纳学习。由于一棵决策树就表示了一组产生式规则,因此决策树学习也是一种规则学习。特别地,当规则是某
5、概念的判定规则时,这种决策树学习也就是一种概念学习。13ppt课件决策树学习的基本方法和步骤是决策树学习的基本方法和步骤是:首先,选取一个属性,按这个属性的不同取值对实例集进行分类;并以该属性作为根节点,以这个属性的诸取值作为根节点的分枝,进行画树。然后,考察所得的每一个子类,看其中的实例的结论是否完全相同。如果完全相同,则以这个相同的结论作为相应分枝路径末端的叶子节点;否则,选取一个非父节点的属性,按这个属性的不同取值对该子集进行分类,并以该属性作为节点,以这个属性的诸取值作为节点的分枝,继续进行画树。如此继续,直到所分的子集全都满足:实例结论完全相同,而得到所有的叶子节点为止。这样,一棵决
6、策树就被生成。下面我们进一步举例说明。14ppt课件表表1 汽车驾驶保险类别划分实例集汽车驾驶保险类别划分实例集 15ppt课件可以看出,该实例集中共有12个实例,实例中的性别、年龄段和婚状为3个属性,保险类别就是相应的决策项保险类别就是相应的决策项。为表述方便起见,我们将这个实例集简记为 S=(1,C),(2,C),(3,C),(4,B),(5,A),(6,A),(7,C),(8,B),(9,A),(10,A),(11,B),(12,B)其中每个元组表示一个实例,前面的数字为实例序号,后面的字母为实例的决策项保险类别(下同)。另外,为了简洁,在下面的决策树中我们用“小”、“中”、“大”分别代
7、表“21”、“21且25”、“25”这三个年龄段。16ppt课件显然,S中各实例的保险类别取值不完全一样,所以需要将S分类。对于S,我们按属性“性别”的不同取值将其分类。由表1可见,这时S应被分类为两个子集:S1=(3,C),(4,B),(7,C),(8,B),(11,B),(12,B)S2=(1,C),(2,C),(5,A),(6,A),(9,A),(10,A)于是,我们得到以性别作为根节点的部分决策树(见图4(a)。17ppt课件考察S1和S2,可以看出,在这两个子集中,各实例的保险类别也不完全相同。这就是说,还需要对S1和S2进行分类。对于子集S1,我们按“年龄段”将其分类;同样,对于子
8、集S2,也按“年龄段”对其进行分类(注意:对于子集S2,也可按属性“婚状”分类)。分别得到子集S11,S12,S13和S21,S22,S23。于是,我们进一步得到含有两层节点的部分决策树(如图4(b)所示)。18ppt课件注意到,这时除了S12和S13外,其余子集中各实例的保险类别已完全相同。所以,不需再对其进行分类,而每一个子集中那个相同的保险类别值就可作为相应分枝的叶子节点。添上这些叶子节点,我们又进一步得到发展了的部分决策树(如图4(c)所示)。接着对S12和S13,按属性“婚状”进行分类(也只能按“婚状”进行分类)。由于所得子集S121,S121和S131,S132中再都只含有一个实例
9、,因此无需对它们再进行分类。这时这4个子集中各自唯一的保险类别值也就是相应分枝的叶子节点。添上这两个叶子节点,就得到如图4(d)所示的决策树。19ppt课件图4 决策树生成过程 20ppt课件图4 决策树生成过程 21ppt课件图4 决策树生成过程 22ppt课件图4 决策树生成过程 23ppt课件由这个决策树即得下面的规则集:女性且年龄在25岁以上,则给予A类保险.女性且年龄在21岁到25岁之间,则给予A类保险。女性且年龄在21岁以下,则给予C类保险。男性且年龄在25岁以上,则给予B类保险。男性且年龄在21岁到25岁之间且未婚,则给予C类保险。男性且年龄在21岁到25岁之间且已婚,则给予B类
10、保险。男性且年龄在21岁以下且未婚,则给予C类保险。男性且年龄在21岁以下且已婚,则给予B类保险。24ppt课件25ppt课件人工神经网络人工神经网络1 1 生物神经元及人工神经元的组成生物神经元及人工神经元的组成2 2 人工神经网络的模型人工神经网络的模型 2 2.1 .1 人工神经元的模型人工神经元的模型 2 2.2 .2 常用的激活转移函数常用的激活转移函数 2 2.3 MP.3 MP模型神经元模型神经元26ppt课件神经元神经元也称神经细胞,它是生物神经系统的最基本单元,也称神经细胞,它是生物神经系统的最基本单元,它和人体中其他细胞的关键区别在于具有产生、处理和传递它和人体中其他细胞的
11、关键区别在于具有产生、处理和传递信号的功能。每个神经元都包括三个主要部分:细胞体、树信号的功能。每个神经元都包括三个主要部分:细胞体、树突和轴突,见突和轴突,见图图5 5(a a)。)。(a)简单神经元网络图 (b)简化后的网络示意图(1)细胞体;(2)树突;(3)轴突;(4)突触图5 简单神经元网络及其简化结构图27ppt课件v 由一定数量的基本神经元分层联接;v 每个神经元的输入、输出信号以及综合处理内容都比较简单;v 网络的学习和知识存储体现在各神经元之间的联接强度上。28ppt课件 2.12.1人工人工神经元的神经元的模型模型 神经元是人工神经网络的基本处理单元,它一般是一个多输入/单
12、输出的非线性元件。神经元输出除受输入信号的影响外,同时也受到神经元内部因素的影响,所以在人工神经元的建模中,常常还加有一个额外输入信号,称为偏差,有时也称为阈值或门限值。29ppt课件 神经元神经元的输出矢量可以表示为:的输出矢量可以表示为:A=f(W*P+b)=f(wj pj+b)可以可以看出偏差被简单地加在看出偏差被简单地加在W W*P P上作为激活函数的另一个输入上作为激活函数的另一个输入分量。实际上偏差也是一个权值,只是它具有固定常数为分量。实际上偏差也是一个权值,只是它具有固定常数为1 1的的权值权值。在网络的设计中,偏差起着重要的作用,它使得激活函数的图形在网络的设计中,偏差起着重
13、要的作用,它使得激活函数的图形可以左右移动,从而增加了解决问题的可能性。可以左右移动,从而增加了解决问题的可能性。人工神经网络的学习就是过程就是对它的训练过程30ppt课件2 2.2 .2 激活转移函数激活转移函数激活转移函数f(Activation transfer function)简称激活函数,它是一个神经元及神经网络的核心之一。神经网络解决问题的能力与功效除了与网络结构有关外,在很大程度上取决于网络激活函数。线性函数、非线性斜面函数、阈值函数、S形函数31ppt课件人工神经网络是对人类神经系统的一种模拟。尽管人类神经系统规模宏大、结构复杂、功能神奇,但其最基本的处理单元却只有神经元。人
14、工神经系统的功能实际上是通过大量神经元的广泛互连,以规模宏伟的并行运算来实现的。基于对人类生物系统的这一认识,人们也试图通过对人工神经元的广泛互连来模拟生物神经系统的结构和功能。人工神经元之间通过互连形成的网络称为人工神经网络。在人工神经网络中,神经元之间互连的方式称为连接模式或连接模型。它不仅决定了神经元网络的互连结构,同时也决定了神经网络的信号处理方式。32ppt课件人工神经网络的分类人工神经网络的分类 目前,已有的人工神经网络模型至少有几十种,其分类方法也有多种。例如,若按网络拓扑结构,可分为无反馈网络与有反馈网络;若按网络的学习方法,可分为有导师学习网络和无导师学习网络;若按网络的性能
15、,可分为连续型网络与离散型网络,或分为确定性网络与随机型网络;若按突触连接的性质,可分为一阶线性关联网络与高阶非线性关联网络。33ppt课件无导师学习:当两个神经元同时处于激发状态时被加强,否则被减弱。它学习的是神经元之间的连接强度。有导师学习:输入向量与其输出向量构成一个训练对,不断调整权值,使输入与输出向量在一个误差范围内。34ppt课件人工神经网络的局限性人工神经网络的局限性人工神经网络是一个新兴学科,因此还存在许多问题。其主要表现有:1.受到脑科学研究的限制:由于生理实验的困难性,因此目前人类对思维和记忆机制的认识还很肤浅,还有很多问题需要解决;2.还没有完整成熟的理论体系;3.还带有
16、浓厚的策略和经验色彩;4.与传统技术的接口不成熟。上述问题的存在,制约了人工神经网络研究的发展。35ppt课件2 2.3 MP.3 MP神经元模型神经元模型 MP神经元模型是由美国心理学家McClloch和数学家Pitts共同提出的,因此,常称为MP模型。MP神经元模型是典型的阈值型神经元,见图7,它相当于一个多输入单输出的阈值器件。w1w2wrp1p2pr briiibpwfA1 图7 MP模型神经元36ppt课件 如图7所示,假定p1,p2,pn表示神经元的n个输入;wi表示神经元的突触连接强度,其值称为权值;n 表示神经元的输入总和,f(n)即为激活函数;a 表示神经元的输出,b 表示神
17、经元的阈值,那么MP模型神经元的输出可描述为(1)式所示:w1w2wrp1p2pr briiibpwfa1图7 MP模型神经元riiibpwnnfa1(1)37ppt课件MP模型神经元是二值型神经元,其输出状态取值为1或0,分别代表神经元的兴奋和抑制状态。如果 N 0,即神经元输入加权总和超过某个阈值,那么该神经元兴奋,状态为1;如果N 0,那么该神经元受到抑制,状态为0。通常,将这个规定称为MP模型神经元的点火规则。用一数学表达式表示为:对于 MP模型神经元,权值w在(1,1)区间连续取值。取负值表示抑制两神经元间的连接强度,正值表示加强。1000NAf nN(2)38ppt课件为了为了回答
18、这个问题回答这个问题,我们我们以简单的逻辑代数运算为例来说明。以简单的逻辑代数运算为例来说明。39ppt课件例例1 1 假设一个假设一个MPMP模型神经元有模型神经元有2 2个输入:个输入:P P1 1和和P P2 2,其,其目标输出记为目标输出记为T T,试问它能否完成下列真值表功能?,试问它能否完成下列真值表功能?解:根据要求,神经元的权值和阈值必须满足如下不等式组:若取b值为0.5,W1和W2取0.7。可以验证用这组权值和阈值构成的2输入MP模型神经元能够完成该逻辑“或”运算。00201021WWWW00201021bbWbWbWW(1)(2)(3)(4)不 等 式 组真 值 表 p1
19、p2 t 1 1 1 1 0 10 1 1 0 0 040ppt课件如同许多代数方程一样,由MP模型激活函数得出的不等式具有一定的几何意义,所有输入样本构成样本输入空间。对于任意特定W和P的值都规定了一个超平面(决策平面),其方程为:它把超平面Rn(XRn)分成了两部分:WX-b0G(X)0;当;当X X点在超平面点在超平面的负侧时,的负侧时,G(X)0G(X)0 0w57ppt课件支持向量机的应用现状支持向量机的应用现状 VM人脸检测、验证和识别 Osuna最早将SVM应用于人脸检测,并取得了较好的效果。其方法是直接训练非线性分类器完成人脸与非人脸的SVM分类。由于SVM的训练需要大量的存储
展开阅读全文