高级人工智能机器学习课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《高级人工智能机器学习课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高级 人工智能 机器 学习 课件
- 资源描述:
-
1、2机器学习机器学习就是计算机自动获取知识,它是知识工程的三个分支(知识获取、知识表示和知识推理)之一,是AI中一个重要的研究领域,一直受到人工智能和认知心理学家们的普遍关注。机器学习涉及计算机科学、数学、心理学、生理学等多个交叉学科,涉及的面比较宽,许多理论和技术的问题尚处于研究阶段。从IJCAI,当前AI中三个研究热点:机器学习、知识表示和推理、多Agent系统 参考文献 6.1 概述 6.2 机器学习系统的基本模型 6.3 机械学习(Rote Learning)6.4 归纳学习(Inductive Learning)6.5 强化学习(Reinforcement Learning)6.6 统
2、计学习(Statistical Learning)6.7 多示例学习(Learning)本章小结第6章机器学习4 蔡自兴,徐光佑.人工智能及其应用.清华大学出版社.2004:第6章 Tom M.Mitchell,机器学习,曾华军等译,机械工业出版社,2003年1月第一版 史忠植.高级人工智能.科学出版社,1998年:第6章/第7章/第8章 陆汝钤 编著:人工智能(下册)第20章/第21章 T.Mitchell,The discipline of machine learning,July 2006 R.E.Schapire(2001),The Boosting Approach to Mach
3、ine LearningAn Overview,见网页http:/www.cs.princeton.edu/schapire/boost.html Lawrence R.Rabiner(1989),A tutorial on Hidden Markov Models&selected applications in speech recognitionthe Proc.of IEEE(Vol.77,No.2)第6章 机器学习方法5 关于支持向量机学习,一本值得推荐的参考书是:邓乃扬、田英杰著:数据挖掘中的新方法支持向量机,科学出版社,2004年6月/特点:从基础开始讲起、详细、透彻第6章 机器
4、学习方法6机器学习顶级期刊 Machine Learning Journal of Machine learning research ACM Transactions on Knowledge Discovery from Data Data Mining and Knowledge Discovery 第6章机器学习7机器学习顶级会议 ICML(International Conference on Machine Learning)ECML(European Conference on Machine Learning)86.1 概述6.1.1 什么是机器学习 6.1.2 研究机器学习的
5、意义 6.1.3 机器学习的发展史 6.1.4 机器学习的主要策略第6章机器学习9学习的概念:学习是系统改善其性能的过程(西蒙)。即,学习就是系统在不断重复的工作中对本身的一种改变,使其能力得到增强或改进,使得系统在下一次执行同样任务或类似任务时,会比现在做的更好或效率更高/影响较大。学习就是知识获取。由从事专家系统的人提出,因为在专家系统的建造中,知识的自动获取是非常困难的。所以知识获取似乎就成了学习的本质,但是获取的知识有时不会使系统的性能有所改善。技巧的获取往往是通过大量时间或反复的训练进行,在获取技巧时,知识获取只起到了很小的作用。第6章机器学习10 学习是对客观经验表示的构造或修改。
6、客观经验包括对外界事物的感受,以及内部的思考过程,学习系统就是通过这种感受和思考过程来获取对客观世界的认识的。其核心问题就是对这种客观经验的形式进行构造和修改 学习是客观规律的发现过程。这种观点将学习看作是从感性认识到理性认识的认识过程,从表层知识到深层知识的特化过程,也就是说学习就是发现事物规律,上升形成理论的过程。学习是一个有特定目的的知识获取过程,其内在行为是获取知识、积累经验、发现规律,其外在表现是使系统性能得到改进、系统实现自我完善、自适应环境。第6章机器学习11 机器学习是研究如何使用计算机来模拟人类学习活动的一门科学。更严格的讲,是研究计算机获取新知识和新技能、识别现有知识、不断
7、改善性能、实现自我完善的方法。机器学习研究的目标人类学习过程的认知模型:对人类学习机制的研究,希望能从中受到启发。通用学习算法:对人类学习过程的研究,探索各种可能的学习方法,建立起独立于具体应用领域的通用学习算法。构造面向任务的专业学习系统:要解决专门的实际问题,并开发完成这些专门任务的学习系统。第6章机器学习12研究机器学习的意义(1)机器学习是研究怎样使用计算机模拟人类学习活动的机器学习是研究怎样使用计算机模拟人类学习活动的科学,是科学,是AIAI中最具有智能特征、最前沿的研究领域之中最具有智能特征、最前沿的研究领域之一,机器学习的一个重大进步就标志着一,机器学习的一个重大进步就标志着AI
8、AI甚至整个计甚至整个计算机科学向前迈进了一步。意义:算机科学向前迈进了一步。意义:学习速度学习速度:人类的学习是一个相当缓慢而又艰苦的过:人类的学习是一个相当缓慢而又艰苦的过程,受到身体生长发育和生理规律的限制。人类学习程,受到身体生长发育和生理规律的限制。人类学习从幼年开始,大约需要从幼年开始,大约需要2020年的时间才能掌握人类生活年的时间才能掌握人类生活中的基本技能,而且还必须中的基本技能,而且还必须“活到老,学到老活到老,学到老”。而。而机器学习却能以惊人的速度进行,而且机器可以不用机器学习却能以惊人的速度进行,而且机器可以不用休息,其学习速度是人类无法比拟的:休息,其学习速度是人类
9、无法比拟的:第6章 机器学习13研究机器学习的意义(2)知识积累知识积累:人类的知识不具有继承性,而机器的知识:人类的知识不具有继承性,而机器的知识具有继承性。一个人一生可能积累了很多知识,但是具有继承性。一个人一生可能积累了很多知识,但是一旦生命结束,这些知识也就随之消失了,不能把知一旦生命结束,这些知识也就随之消失了,不能把知识遗传给后代子孙。如,任何人都必须从小学开始。识遗传给后代子孙。如,任何人都必须从小学开始。如果机器具有学习能力,就可以把知识不断延续下去,如果机器具有学习能力,就可以把知识不断延续下去,避免大量的重复学习,使知识积累达到新的高度。避免大量的重复学习,使知识积累达到新
10、的高度。知识传播知识传播:一个人拥有了很多知识,但是很难让别人:一个人拥有了很多知识,但是很难让别人像他一样拥有这些知识,其他人必须从头学起。对于像他一样拥有这些知识,其他人必须从头学起。对于机器而言,只要一台机器学会了,其他机器只要简单机器而言,只要一台机器学会了,其他机器只要简单复制就学会了。利用机器学习有利于知识传播复制就学会了。利用机器学习有利于知识传播综上所述,机器学习学习速度快、便于知识积累、利综上所述,机器学习学习速度快、便于知识积累、利于知识传播,因此在机器学习领域的一点进步,就会于知识传播,因此在机器学习领域的一点进步,就会使得计算机能力显著增强,从而对人类产生影响。使得计算
11、机能力显著增强,从而对人类产生影响。第6章机器学习14机器学习的应用无处不在 网络入侵检测 天气预报 地震预警 互联网搜索引擎。15机器学习的发展史(1)1.从20世纪50年代中期到60年代中期,属于热烈时期 研究目标是应用决策理论的方法,研制各类自组织系统、自适应的学习系统;基本思想是:系统是一个由互连的元件组成的网络,网络结构可能是任意的,那么这些元件类似于神经原;如果给系统一组刺激、一个反馈源和一个修改自身组织的自由度,则系统就可以自适应地趋向最优化 指导本阶段的理论基础是早在20世纪40年代开始的神经网络模型;典型代表:1957年F.Rosenbatt提出的感知器算法,第一个具有重要学
12、术意义的机器学习算法。第6章机器学习16机器学习的发展史(2)2.从20世纪60年代中期到70年代中叶,属于冷时期 研究目标:模拟人类的概念学习过程,并采用逻辑结构或图结构作为机器的内部描述。研究者们力图在高层知识符号表示的基础上建立人类的学习模型,使机器能够采用符号来描述概念,并提出关于概念的各种假设。代表性工作:温斯顿(Winston)的结构学习系统和海斯罗斯(Hayes Roth)等的基于逻辑的归纳学习系统 虽然这里学习系统取得了较大成功,但只能学习单一概念,并且未能投入实际应用。第6章机器学习17机器学习的发展史(3)3.从20世纪70年代中期到80年代中叶,属于复兴时期 研究从学习单
13、个概念扩展到学习多个概念,探索不同的学习策略和各种学习方法。知识学习的过程一般都建立在大规模知识库上,实现知识强化学习 把学习系统与具体应用相结合,取得了很大成功,促进了机器学习的发展 1980年,在美国的卡内基梅隆大学召开了第一届机器学习国际研讨会,标志着机器学习已在全世界兴起,从此人工智能进入应用阶段 1986年,Machine Learning创刊,迎来了机器学习蓬勃发展的新时期第6章机器学习18机器学习的发展史(4)4.从1986年开始,机器学习进入新阶段 从事神经元模型研究的学者们,经过10多年的潜心研究,克服了神经元模型的局限性,使得神经网络的研究重新兴起。实验研究和应用研究得到前
14、所未有的重视。第6章机器学习19机器学习的主要策略(1)学习过程与推理过程是紧密相连的,学习中使用的推理方法称为学习策略学习过程中推理过程实际上就是一种变换过程,它将系统外部提供的信息变换为符号系统内部表达的新的形式,以便对信息进行存储和使用。这种变换的性质就决定了学习策略的类型。几种基本的学习策略:机械学习:又称记忆学习。不需要任何推理过程,外面输入知识的表示方式与系统内部表示方式完全一致,不需要任何处理和变换。利用计算机的存储容量大,检索速度快,记忆精确。如下棋程序,将棋局及得分放入电脑,走棋时尽量选使自己分数高的棋局第6章机器学习20机器学习的主要策略(2)传授学习:又称指导式、示教学习
15、。外界输入知识的表示方式与系统内部表达方式不完全一致,系统在接受外部知识时,需要一点推理、翻译和转化工作。演绎学习:系统由给定的知识进行演绎的保真推理,并存储有用的结论。最近几年才成为一种独立的学习策略。演绎学习包括知识改造、知识演绎、产生宏操作、保持等价的操作和其他保真变换。归纳学习:应用归纳推理进行学习。按其有无教师指导,可以分为实例学习及观察与发现学习:实例学习:概念获取,通过向学习者提供某一概念的一组正例和反例,使学习者从这些正反例中归纳推理出概念的一般描述/这个描述应能理解所有给定的正第6章机器学习21机器学习的主要策略(3)例并排除所有给定的反例。这些正反例是由信息源提供的,信息源
16、可能是已知概念的教师,也可以是学习者本身,还可以是学习者以外的环境观察和发现学习:描述的一般化。没有教师指导,它要产生对所有或大多数观察到的规律和规则。这类学习包括概念聚类、构造分类、曲线拟合、发现并解释观察到的定律并形成理论。类比学习:在遇到新问题时,可以学习以前解决过的类似问题的解决方法,来解决当前问题。寻找与当前问题相似的已知问题很重要,并且必须能够发现当前任务与已知任务的相似之处,由此制定完成当前任务的方案。第6章机器学习22 基于解释的学习(Explanation-based learning,EBL)。学生根据教师提供的目标概念、该概念的一个例子、领域理论及可操作准则,首先构造一个
17、解释来说明为什该例子满足目标概念,然后将解释推广为目标概念的一个满足可操作准则的充分条件。EBL已被广泛应用于知识库求精和改善系统的性能。著名的EBL系统有迪乔恩(G.DeJong)的GENESIS,米切尔(T.Mitchell)的LEXII和LEAP,以及明斯顿(S.Minton)等的PRODIGY。基于解释的学习从本质上说属于演绎学习,它是根据给定的领域知识,进行保真的演绎推理,存储有用结论,经过知识的求精和编辑,产生适于以后求解类似问题的控制知识。23机器学习方法的分类从训练样本的歧义性(ambiguity),分为 监督学习:它通过对具有概念标记(concept label)的训练样例进
18、行学习,以尽可能正确地对训练集之外的示例的概念标记进行预测。/所有训练例的概念标记都是已知的,因此训练样本的歧义性最低。无监督学习:它通过对没有概念标记的训练例进行学习,以发现训练例中隐藏的结构性知识/这里的训练例的概念标记是不知道的,因此训练样本的歧义性最高。强化学习:它通过对没有概念标记、但与一个延迟奖赏或效用(可视为延迟的概念标记)相关联的训练例进行学习,以获得某种从状态到行动的映射。这里本来没有概念标记的概念,但延迟奖赏可被视为一种延迟概念标记,因此其训练样本的歧义性介于监督学习和非监督学习之间。24 半监督学习(semi-supervised learning):部分标记。用户期望用
19、未标记的样本来辅助对已标记样本的学习。256.3 机械学习(Rote Learning)6.3.1 机械学习的过程 6.3.2 机械学习系统要考虑的问题第6章机器学习26 机械学习:记忆学习、死记硬背式学习:直接记忆或存储环境提供的新知识,并在以后通过对知识库的检验来直接使用这些知识,而不再需要进行任何的计算和推导。机械学习是一个基本的学习过程,虽然它没有独立处理事物的能力,但存储对于任何智能型的程序来说,都是必要和基本的。记忆学习是任何学习系统的一部分,任何学习系统都要将它所获取的知识存储在知识库中,以便利用这些知识。第6章机器学习27机械学习过程(1)机械学习的学习过程是这样的:执行机构每
20、解决一个问题,系统就记住这个问题和它的解。把执行机构抽象地看成是某一函数F,该函数得到输入是(x1,x2,xn),经推导计算后得到输出为(y1,y2,yn),如果经过评价得知该计算是正确的,则就把联想对(x1,x2,xn),(y1,y2,yn)存入知识库中,在以后需要计算F(x1,x2,xn)时,系统的执行机构就直接从知识库中把(y1,y2,yn)检索出来,而不需要再重复计算。第6章机器学习28 学习过程 应用过程(x1,x2,xn)计算(y1,y2,yn)存储(x1,x2,xn),(y1,y2,yn)(x1,x2,xn)检索(y1,y2,yn)输出(x1,x2,xn),(y1,y2,yn)2
21、9应用举例(1)例:要设计一个汽车修理成本估算系统。该系统的输入信息是关于待修理汽车的描述,包括制造厂商、出厂日期、车型、汽车损坏部件以及损坏程度;输出则是该汽车的修理成本。为了进行估算,系统必须在知识库中找同一厂商、同一出厂日期、同一车型、同样损坏情况的汽车,然后把知识库中对应的数据作为修理成本的估算数据输出给用户/如果在知识库中没有找到这样的汽车,则系统将请求用户给出大概的费用并进行确认,系统则将该车的描述和经过确认的费用存储到知识库中,以便下次查找使用。虽然机械学习在方法上看来很简单,但是由于计算机的存储量大、检索速度快、记忆准确,因此也能产生意想不到的结果。第6章机器学习30举例(2)
22、应用记忆学习的一个典型例子是塞缪尔的CHECKERS跳棋程序。该程序采用极大极小方法搜索博奔树在约定的搜索深度用估价函数F对格局进行评分,然后通过倒推计算求出上层节点的例推值,以决定当前的最佳走步。CHECKERS的学习环节把每个格局的倒推值都记录下来,当下次遇到相同的情况时,就直接利用“记住”的例推值决定最位走步,而不必重新计算。例如,设在某一格局A时轮到CHECKERS走步它向前搜索三步,得到如图所示的搜索树。31 在上图中,根据对端节点的静态伯值,可求得A的例推值为6,最佳走步是走向c。这时CHECKERS就记住A及其倒推值6。假若在以后的博弈中又出现了格局A且轮到它走步,则它就可以通过
23、检索直接得到A的倒推值,而不必再做倒推计算,这就提高了效率。32机械学习系统要考虑的问题机械学习系统要考虑的问题(1)机械学习系统不具备推理能力,只是将所有的信息存入计算机来增加知识,其实质上是以存储空间换取计算时间。虽然节省了计算时间,但却多用了存储空间。因此,机械学习系统设计时需要考虑三个问题 知识库的存储结构;只有当对知识的检索所需时间少于重新计算的时间时,机械学习才有效。为了快速检索知识库的内容,要合理组织。因此,采用适当的存储方式,使检索速度尽可能的快,是机械式学习中的重要问题。环境的稳定性与存储信息的适用性:在急剧变化的情况下,机械学习不适用。机械学习的一个重要假设是认为保存的知识
24、或信息以后仍然有效。如果环境变化快,这个假设就破坏了。因此,机械学习必须保证所保存的信息适应于外界环境变化的需要,即所谓的信息适用性问题。第6章机器学习33机械学习系统要考虑的问题机械学习系统要考虑的问题(2)随时监控环境的变化,不断更新知识库中保存的信息或知识。例如当发现某种汽车被淘汰了,则把与这种汽车相关的知识删除。存储与计算之间的衡量 在解决一个新问题时,是利用知识库的知识还是重新计算,需要权衡比较二者的代价。在权衡到底是存储还是利用计算时,考虑两方面:在首次得到一条信息时,确定是否要保存它,这时要考虑该信息以后的使用概率、存储空间和计算代价 为了保证足够的检索速度,需要尽量精简知识库的
25、内容(存储的越多检索速度越慢)。因此,对保存的内容在读取时加上时间标志,表示最后使用的时间,当保存一项新内容时,要删除一项未使用时间最长的旧内容。第6章机器学习346.4 归纳学习(Inductive Learning)实例学习/观察与发现学习第6章机器学习35归纳学习归纳是人类拓展认识能力的重要方法,是一种从个别到一般、从部分到整体的推理行为归纳推理利用归纳方法,从足够多的具体实例中归纳出一般性知识,提取事物的一般性规律,它是一种从个别到一般的推理归纳推理的特点:能够产生新知识,但不保真,保假归纳学习是应用归纳推理进行学习的一种方法;归纳学习旨在根据给定关于某个概念的一系列已知的正例和反例,
展开阅读全文