浙江大学计算机学院研究生《人工智能引论》课件.ppt.ppt

上传人（卖家）：三亚风情

文档编号：2774459

上传时间：2022-05-25

格式：PPT

页数：89

大小：365KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

28 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《浙江大学计算机学院研究生《人工智能引论》课件.ppt.ppt》由用户（三亚风情）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 人工智能引论浙江大学计算机学院研究生人工智能引论课件 ppt

资源描述：: 1、1浙江大学计算机学院研究生人工智能引论课件浙江大学计算机学院研究生人工智能引论课件第第13讲讲智能智能Agent及多及多Agent系统系统Chapter 13 Intelligent Agent & Multi-Agent Systems浙江大学人工智能研究所浙江大学人工智能研究所20032003年第一稿年第一稿20052005年年1010月修改补充月修改补充20072007年年1010月第二次修改月第二次修改谢谢观赏2019-8-182内容1. 概述概述2. 分布式问题求解分布式问题求解3. Agent4. Agent理论理论5. Agent结构结构6. Agent通信通信7. Agent
2、的协调与协作的协调与协作8. 多多Agent环境环境MAGE9. 面向面向Agent的软件技术的软件技术10. Mobile Agent11. 若干前沿问题讨论若干前沿问题讨论谢谢观赏2019-8-18313.1 概述概述分布式人工智能（DAI）主要研究在逻辑上逻辑上或物理上物理上分散的智能系统如何并行的、相互协作地实现问题求解。两种解决问题的方法：自顶向下自顶向下：分布式问题求解自底向上自底向上：基于Agent的方法谢谢观赏2019-8-184 DAI系统的特色系统的特色1) 系统中的数据、知识, 以及控制不但在逻辑上, 而且在物理上是分布的, 既没有全局控制, 也没有全局的数据存储
3、。2) 各个求解机构由计算机网络互连, 在问题求解过程中, 通信代价要比求解问题的代价低得多。3) 系统中诸机构能够相互协作, 来求解单个机构难以解决, 甚至不能解决的任务。谢谢观赏2019-8-185DAI系统的主要优点系统的主要优点1) 提高问题求解能力提高问题求解能力2) 提高问题求解效率提高问题求解效率3) 扩大应用范围扩大应用范围4) 降低软件的复杂性降低软件的复杂性谢谢观赏2019-8-18613.2 分布式问题求解特点：特点：数据、知识、控制均分布在系统的各节点上，既无全局控制，也无全局数据和知识存储。两种协作方式两种协作方式：任务分担结果共享谢谢观赏2019-8-18713
4、.2.1 分布式问题求解系统分类根据组织结构，分布式问题求解系统可以分为三类：层次结构类平行结构类混合结构类谢谢观赏2019-8-18813.2.2 分布式问题求解过程分布式问题求解过程可以分为四步：任务分解任务分配子问题求解结果综合谢谢观赏2019-8-189分布式问题求解系统中协作的分类按节点间协作量的多少，协作分为三类：全协作系统无协作系统半协作系统常用的通信方式有：共享全局存储器信息传递黑板模型谢谢观赏2019-8-181013.3 智能智能Agent及多及多Agent系统系统多Agent系统主要研究在逻辑上或物理上分离的多个Agent协调其智能行为，即知
5、识、目标、意图及规划等，实现问题求解。可以看作是一种由底向上设计的系统。谢谢观赏2019-8-1811Agent的思想的思想智能Agent的几个典型的实例： Microsoft的Office助手计算机病毒（破坏Agent）计算机游戏或模拟中的智能角色贸易和谈判Agent（如Ebay的拍卖Agent）网络蜘蛛Web Spider（搜索引擎中的数据搜集和索引Agent，如Google）谢谢观赏2019-8-1812Agent概念的出现概念的出现面向过程的方法面向过程的方法面向实体的方法面向实体的方法面向对象的方法面向对象的方法面向面向Agent的方法的方法软件开发方法的进化软件开发方法的
6、进化谢谢观赏2019-8-1813Agent的定义的定义在计算机和人工智能领域中，Agent可以看作是一个实体实体，它通过传传感器感器感知环境，通过效应器效应器作用于环境。谢谢观赏2019-8-1814Agent的强定义的强定义基于某种场景，并具有灵活、自主基于某种场景，并具有灵活、自主的行为能力，以满足设计目标的计算机的行为能力，以满足设计目标的计算机系统。系统。谢谢观赏2019-8-1815Agent的弱定义的弱定义满足如下特征的基于硬件或（更经满足如下特征的基于硬件或（更经常是）软件的计算机系统：常是）软件的计算机系统：自主性自主性( (Autonomy)Autonomy) 社会
7、性社会性( (Social ability)Social ability) 反应性反应性( (Reactivity)Reactivity) 主动性主动性( (Pro-activeness)Pro-activeness)（或称或称“前前瞻性瞻性”）基于场景性基于场景性( (SituatednessSituatedness) ) 灵活性灵活性( (Flexibility)Flexibility)谢谢观赏2019-8-1816 移动性移动性( (Mobility)Mobility) 理性理性( (Rationality)Rationality)此外，许多学者还提出一些其它特性：此外，许多学者还提
8、出一些其它特性：诚实性诚实性( (Veracity)Veracity) 友好性友好性( (Benevolence)Benevolence) 长寿性（或时间连贯性）长寿性（或时间连贯性）自适应性自适应性( (Adaptability)Adaptability) 谢谢观赏2019-8-1817Agent的特性的特性Agent弱概念：弱概念：自治性、社会能力（可通信性）、反应能力、自发行为Agent强概念：强概念：知识、信念、意图、承诺等心智状态其它属性：其它属性：长寿性、移动性、推理能力、规划能力、学习和适应能力、诚实、善意、理性谢谢观赏2019-8-181813.4 Agent理论理论智能
9、Agent的理论模型研究主要从逻辑、行为、心理、社会等角度出发，对智能Agent的本质进行描述，为智能Agent系统创建奠定基础。谢谢观赏2019-8-1819可能世界模型可能世界模型( (Possible Worlds Possible Worlds Model)Model) 地位：地位：Agent理论基础的开创性工作之一。思想思想：将Agent的知识、信念等特征化为一系列“可能世界”，在可能世界模型中包括对象、属性及其关系。优点优点：理论基础（特别是模态逻辑）比较完善。缺点：缺点：存在“逻辑万能”(Logical Omniscience)问题。谢谢观赏2019-8-1820“意图系统意
10、图系统”(”(Intentional System) Intentional System) 作用：作用：用于描述其行为可用信念、愿望等理性智慧来预测的实体。分为：一阶和二阶两种形式。对象、属性及其关系。谢谢观赏2019-8-1821“意图姿态意图姿态”(”(Intentional Stance) Intentional Stance) 意义：意义：启发AI学者将信念(Belief)、愿望(Desire)、承诺(Commitment)等人类特有的思想和概念应用于Agent。谢谢观赏2019-8-182213.4.1 理性理性Agent（BDI模型）模型）思想思想：认为Agent行为可由信念、
11、愿望和意图来表达作用作用：已成为经典模型，并被广泛采用Belief信念，Agent对环境的基本看法。Desire愿望，Agent想要实现的状态，即目标。Intention意图，目标的子集。谢谢观赏2019-8-182313.4.2 BDIAgent模型模型BDIAgent模型可以通过下列要素描述：一组关于世界的信念； Agent当前打算达到的一组目标；一个规划库，描述怎样达到目标和怎样改变信念；一个意图结构，描述Agent当前怎样达到它的目标和改变信念。谢谢观赏2019-8-1824BDI解释器解释器BDI-Interpreterinitialize-state();dooptions
12、:= option-generator(event-queue, B, G, I);selected-options := deliberate(options, B, G, I);update-intentions(selected-options, I);execute(I);get-new-external-events();drop-successful-attitudes(B,G,I);drop-impossible-attitudes(B,G,I);until quit谢谢观赏2019-8-182513.4.3 RAO逻辑框架逻辑框架目标：目标：以一种自然的方式描述多Agent系统
13、中关于别的Agent的状态的推理过程。系统的分类：系统的分类：由于多Agent系统太复杂，建立一种通用的推理模式的想法是不现实的，有必要对系统分类以便区别对待。常识的获得：常识的获得：和单个Agent情形一样，常识问题是阻碍推理的大难题。谢谢观赏2019-8-182613.4.4 换位推理换位推理思想：思想：模仿语言学中的虚拟语气，即为了对某个Agent在某种场景下的状态或行为进行推测，设想自己处于那种场景时的状态或行为，再把这种设想结果作为被猜测Agent的状态或行为。作用：作用：使得一Agent对其它Agent的状态和行为的推理过程变得简单明了。谢谢观赏2019-8-182713.4.5
14、动作理论动作理论情景演算是描述动作的主要的形式框架。在情景演算中引入了状态和动作的概念，并利用两条逻辑公理来描述动作与状态的关系。一条公理描述一个动作在满足什么条件的状态之下可能发生，另外一条描述在一个状态之下某个动作发生以后当前状态如何改变。谢谢观赏2019-8-182813.4.6 “言语行为言语行为”理论理论(Speech Acts Theory) 地位地位：这是多Agent交互（通信）的重要理论基础之一。思想思想：任何行为都可以等价地表示为任何行为都可以等价地表示为言语行为言语行为（既任何行为的含义都可用言语来表达），甚至认为所有的行为都是言语行为。作用作用：大大简化了Agent
15、之间交互的复杂度。谢谢观赏2019-8-1829规划库的形式化表示规划库的形式化表示环境状态：State = P1, P2, Pn 目标： Goal=动作模板： Act_template = Agent能力： Ability= 谢谢观赏2019-8-183013.5 Agent结构结构Agent结构需要解决的问题包括： Agent由那些模块组成，模块之间如何交互信息， Agent感知到的信息如何影响它的行为和内部状态，如何将这些模块用软件或硬件的方式组合起来形成一个有机的整体。谢谢观赏2019-8-1831Agent基本结构基本结构环境Agent感知作用黑箱软件黑箱软件Agent谢谢观赏
16、2019-8-1832智能智能Agent的工作过程的工作过程环境交互信息融合信息处理作用交互感知作用谢谢观赏2019-8-1833Agent骨架程序骨架程序function Skeleton-Agent(percept) return actionstatic: memory /* Agent的世界记忆的世界记忆 */memory Update- Memory(memory,percept)action Choose-Best-Action(memory)memory Update-Memory(memory,action)return action谢谢观赏2019-8-1834Agent的分
17、类的分类根据人类思维的层次模型，可以将Agent分成四类：反应Agent 形象思维Agent 抽象思维Agent 复合式Agent 形象思维Agent和抽象思维Agent也可以合称为认知Agent谢谢观赏2019-8-183513.5.1 反应反应Agent环境当前世界传感器动作效应器条件-动作规则Agent谢谢观赏2019-8-1836反应反应Agent程序程序function Reactive-Agent(percept) returns action static: rules, /* 一组条件-动作规则 */ state Interpret-Input(percept) rule
18、 Rule-Match(state,rules) action Rule-Actionrule return action谢谢观赏2019-8-183713.5.2 认知认知Agent环境信息融合传感器动作效应器Agent规划知识库目标内部状态谢谢观赏2019-8-1838认知认知Agent程序程序function Cognitive-Agent(percept) returns actionstatic: environment, /* 描述当前世界环境描述当前世界环境 */ kb, /* 知识库知识库 */ environment Update-World-Model(environm
19、ent,percept) state Update-Mental-State(environment,state) action Decision-Making(state,kb) environment Update-World-Model(environment,action) return action谢谢观赏2019-8-1839BDI结构结构知识信念规划意图目标愿望谢谢观赏2019-8-184013.5.3 复合式复合式Agent决策生成规划反射建模通信感知行动其他智能Agent智能Agent外部世界外部世界预测协作与协商动作请求或应答信息一般情况紧急情况和简单情
20、况谢谢观赏2019-8-1841规划模块规划模块世界的模型（包括其他 Agent的模型）经经验验库库目标集合目标集合局部规划器决决策策生生成成重新规划规划规划目标谢谢观赏2019-8-1842建模模块建模模块世界的模型（包括其他 Agent的模型）模型库模型生成和维护预测规划决策生成感知通信建模谢谢观赏2019-8-1843通信模块通信模块词法库语法库词义库物理通信语言生成语言理解通信谢谢观赏2019-8-184413.6 Agent通信通信策略对话消息黑板协议通信协作协议谢谢观赏2019-8-1845Agent通信中的主要问题通
21、信中的主要问题语义语义：全部有关的Agent必须知道通信语言的语义，消息的语义内容知识是分布式问题求解的核心部分。言语行为言语行为：通信语言也是一种动作，说话是为了使世界的状态发生改变。交互协议交互协议：Agent之间消息交换的典型模式通信语言通信语言：传递消息的标准语法。Foundation for Intelligent Physical Agents http:/www.fipa.org谢谢观赏2019-8-1846Agent间的消息传递间的消息传递消息发送/传输服务器转换到传输格式从传输格式转换消息M言语行为意图I目标GAgent i消息MAgent j谢谢观赏2019-8-1
22、847本体论（本体论（Ontology）本体论是概念化的明确的表示和描述。对某一领域中的概念有共同理解，可以提高交流和协作的效率，从而提高了软件的重用性。谢谢观赏2019-8-1848言语行为言语行为有关言语行为理论的研究主要集中在如何划分不同类型的言语行为。在Agent通信语言的研究中，言语行为理论主要用来考虑Agent之间可以交互的信息类型。谢谢观赏2019-8-1849FIPA通信动作库通信动作库Accept Proposal接受提议接受提议Agree同意同意Cancel取消取消Call for Proposal要求提议要求提议Confirm确认确认Disconfirm确认为否定确认
23、为否定Failure失败失败Inform通知通知Inform If通知通知是否是否Inform Ref通知通知有关对象有关对象Not Understood不理解不理解谢谢观赏2019-8-1850Propagate传播传播Propose提议提议Proxy代理代理Query If询问询问是否是否Query Ref询问询问有关对象有关对象Refuse拒绝（请求）拒绝（请求）Reject Proposal拒绝提议拒绝提议Request请求请求Request When请求请求某个条件下执行某个条件下执行Request Whenever请求请求一旦某个条件成立就执行一旦某个条件成立就执行Su
24、bscribe预定预定详细说明：详细说明：http:/www.fipa.org/repository/cas.html谢谢观赏2019-8-1851交互协议交互协议Agent之间的会话常常形成典型模式，这种之间的会话常常形成典型模式，这种情况下某些消息序列是可知的，这些消息情况下某些消息序列是可知的，这些消息交换的典型模式称为协议。交换的典型模式称为协议。Agent间交互的理想情况：间交互的理想情况：Agent充分地理解充分地理解消息的含意和意图，然后根据自身的信念、消息的含意和意图，然后根据自身的信念、目标等心智状态，做出相应的回答目标等心智状态，做出相应的回答比较实际的实现：预先规范这些协
25、议，规定比较实际的实现：预先规范这些协议，规定好消息的顺序。好消息的顺序。谢谢观赏2019-8-1852FIPA 英国拍卖协议谢谢观赏2019-8-1853通信语言通信语言KQML：由美国ARPA的知识共享计划中提出，规定了消息格式和消息传送系统，为多Agent系统通信和协商提供了一种通用框架。ACL：由FIPA制定的一种规范。与KQML非常相似谢谢观赏2019-8-1854KQML一个例子：一个例子：(ask-all: senderA: receiverB: in-reply-toido: reply-withidl: languageProlog: ontologyfoo: content
26、“bar (X, Y)”)谢谢观赏2019-8-1855FIPA ACL(inform: sender agent1: receiver hpl-auction-server: content (price (bid good02) 150): in-reply-to round-4: reply-with bid04: language s1: ontology hpl-auction)消息结构开始通信动作类型消息参数消息内容表达式参数表达式谢谢观赏2019-8-1856XMLeXtensible Markup Language 可扩展标记语言可扩展标记语言 XML是用于标记电子文件使其具有
27、结构性的标记语言。XML文件本身只是将文件资料结构化。例如：下面的ACL消息(inform:sender jklabrou:receiver grosof:content (CPU libretto50 pentium):ontology laptop:language kif)谢谢观赏2019-8-1857转换为转换为XML格式后如下：格式后如下：informjklabrougrosof谢谢观赏2019-8-1858laptop(CPU libretto50 pentium)kif谢谢观赏2019-8-185913.Agent的协调与协作的协调与协作协调协调(coordination)与协作
28、协作(cooperation)是多Agent研究的核心问题之一。协调是指一组智能Agent完成一些集体活动时相互作用的性质。协作是非对抗的Agent之间保持行为协调的一个特例。谢谢观赏2019-8-1860协调协调多Agent系统中的协调是指多个Agent为了以一致、和谐的方式工作而进行交互的过程。进行协调是希望避免Agent之间的死锁或活锁。死锁指多个Agent无法进行各自的下一步动作；活锁指多个Agent不断工作却无任何进展。谢谢观赏2019-8-1861协作协作目前针对Agent协作的研究大体上可分为两类：1) 将其它领域研究多实体行为的方法和技术用于Agent协作的研究。如对策
29、论和力学研究。2) 从Agent的目标、意图、规划等心智态度出发来研究多Agent间的协作。谢谢观赏2019-8-1862协作规划协作规划协作的动机：1) 某个Agent相信通过协作能带来好处（如提高效率，完成以往单独无法完成的任务）2) 多个Agent在交流的过程中，发现它们能够通过协作来实现更大的目标。谢谢观赏2019-8-1863协作过程协作过程1) 产生需求、确定目标产生需求、确定目标2) 协作规划、求解协作结构协作规划、求解协作结构3) 寻求协作伙伴寻求协作伙伴4) 选择协作方案选择协作方案5) 实现目标实现目标6) 评估结果评估结果谢谢观赏2019-8-186413.8 多多Age
30、nt环境环境MAGEMAGE的主要特点：运行于分布式网络环境用java编写使用模块化的能力通过ADL来描述并生成AgentAgent之间通过ACL通信谢谢观赏2019-8-186513.9 面向面向Agent的软件技术的软件技术在面向Agent的软件开发方法中，应用程序编写为软件Agent，这些Agent之间通过Agent通信语言可以进行比普通消息传递更规范、更明确的通讯。谢谢观赏2019-8-1866Agent与对象的异同与对象的异同共同点共同点：都具有封装性、继承性和多态性。对象的内部状态映射为Agent的心智状态。互操作。不同点不同点： Agent具有自治性，对象只能被动的被调用。
31、 Agent之间交互使用通信语言，对象之间交互是通过互相调用方法。谢谢观赏2019-8-1867AO与与OO 对象是对现实世界中的被动实体的抽象，Agent是对主动实体的很好的抽象。 Agent支持用于表示智能的结构，如信念、承诺等。 Agent支持基于言语行为理论的高级交互，不同于对象之间频繁的消息发送和接收。对象是通过外部来进行控制的（白箱控制），相反，Agent有自治性，不能直接从外部进行控制（黑箱控制）。谢谢观赏2019-8-1868主要的基于主要的基于Agent的方法的方法1) Gaia方法：Wooldridge，Jennings和Kinny在1999年提出了面向Agent分析与设
32、计的Gaia方法学。 2)多Agent工程方法学：Wood和DeLoach提出了多Agent工程方法学MaSE。 3) AUML： Odell等人提出了对UML语言的扩充AgentUML语言AUML语言。谢谢观赏2019-8-1869Gaia方法方法 Gaia是一种同时支持微观级（Agent结构）和宏观级（Agent社会与组织结构）的Agent开发的一般方法。分析过程第一步是找到系统中的角色，第二步是对角色之间的交互进行建模。每个角色包含四个属性：责任、许可、活动和协议设计阶段第一步是把角色映射到一定的Agent类型，然后对不同的Agent类型创建适当的Agent实例；第二步是确定一个
33、和多个Agent中角色所需要的服务模块；最后一步是为Agent之间的通信表示建立熟人模块。谢谢观赏2019-8-1870MaSEMaSE在一般性及应用领域上类似于Gaia，MaSE的目的是引导设计者怎样从初始的系统规范说明到Agent系统的实现。 MaSE在逻辑上被分为七段流水线：捕获目标、应用用例、精练角色、创建Agent类、构造会话、编译Agent类、系统设计。谢谢观赏2019-8-1871AUMLOdell、Parunak和Bauer提出了Agent交互协议AIP的三层表示方法。该方法不仅需要表达语义的修改，而且需要UML可视化语言的修改。AUML已经被提交给UML标准委员会，作为
34、一个建议包含在UML2.0中。谢谢观赏2019-8-187213.10 Mobile Agentl 节约网络带宽节约网络带宽移动Agent直接在数据端执行处理,与客户端不需要进行中间结果的传输,只返回最后的结果。 l 提供实时的远程交互提供实时的远程交互在一些远程控制系统中，如外太空探测器的控制、网络的时延使得远程实时控制变得不可能，发送Mobile Agent实行远端的本地控制可解决该问题。谢谢观赏2019-8-1873 l 支持离线计算支持离线计算用户派遣出Mobile Agent程序后，可以断开网络连接，而Agent将在网络上自主运行。Agent完成任务后，当它发现用户设备重新连上
35、网络时，就返回计算结果。 l 实现载荷卸载实现载荷卸载对于一些计算能力弱的设备，如个人数字助理，可以把计算打包成Agent程序，发送到计算能力强的设备上进行计算。谢谢观赏2019-8-1874 l 提供定制化服务提供定制化服务使用Agent，客户端可以根据服务器端提供的底层操作函数，编写满足自己特定需要的服务程序，然后发送到服务器端运行。 l 易于分发服务易于分发服务在采用Mobile Agent技术的分布式应用中，服务的更改变得非常简单，比如在电信网的管理中，当业务需要改变时，只需把新的服务程序发送到相应的服务节点上，用不着人力去一个一个节点地安装。谢谢观赏2019-8-1875 l
36、增加应用的强壮性增加应用的强壮性移动Agent的工作方式减少了应用对网络连接可靠性的要求，它的自主性又使它具备对环境的反应能力，因此能建立更容错的分布系统。 l 提供平台无关性提供平台无关性移动Agent是跨平台运行的。移动代理应用编程不存在程序的移植问题，便于应用的快速开发。 l 提供更自然的电子商务模式提供更自然的电子商务模式用移动Agent代表用户参与电子交易，买家可在网上自由寻找卖者，查询商品种类，商谈价格，卖家也可主动上门向买家推荐商品。谢谢观赏2019-8-187613.11 若干前沿问题讨论若干前沿问题讨论当前AI中存在的“鸿沟”解决“鸿沟”的主要思路完全自主Agent完
37、全自主Agent的关键技术完全自主Agent的典型应用谢谢观赏2019-8-187713.11.1 当前AI中存在的“鸿沟”Stuart J. Russell的观点在1995年获得IJCAI-95的“Computers and Thought Award”杰出青年大奖时所作的学术报告Rationality and Intelligence 指出“AI是一个由其研究的问题而非方法所是一个由其研究的问题而非方法所定义的领域。定义的领域。”（“AI is a field defined by its problems, not its methods.” Stuart J. Russell, 19
38、95）谢谢观赏2019-8-1878当前当前AI中存在的中存在的“鸿沟鸿沟”（续（续1）当前，AI中存在的最大问题是：如何填补基于抽象、非底层表示（Ungrounded representations）的高层推理高层推理（High-level reasoning）与建立底层表示（Grounded representations）的传感数据解释传感数据解释（Interpreting raw sensor data）之间的“鸿沟鸿沟”。谢谢观赏2019-8-1879当前当前AI中存在的中存在的“鸿沟鸿沟”（续（续2）2001年，Stanford大学计算机系的年轻教授Daphne Koller在获
39、得IJCAI-01的“Computers and Thought Award”杰出青年大奖时所作的学术报告传统AI中被广泛采用的分析、分解方法正面临着很大的挑战：在解决复杂问题时，人们往往很自然地采用分而治之的方法，将其分解为每个“小片”（Fragmentation），等每个“小片”都取得进展后，再进行综合集成以得到最终的结果。但遗憾的是，往往每个子问题都各自分家且相互远离，而且是离得越来越远，最后很难将它们综合集成起来。谢谢观赏2019-8-1880当前当前AI中存在的中存在的“鸿沟鸿沟”（续（续3）“In AI, as in many communities, we have the
40、tendency to divide a problem into well-defined pieces, and make progress on each one. But as we make progress, the problems tend to move away from each other.” Daphne Koller, 2001 谢谢观赏2019-8-188113.11.2 解决鸿沟的主要思路解决鸿沟的主要思路Daphne Koller教授围绕着如何解决上述问题（即填补高层推理与底层数据解释之间的“鸿沟”），提出一种解决方法，就是建立连接的三座“概念桥梁概念桥梁”（
41、Conceptual bridges），分别是：表示表示（Representation）推理推理（Reasoning）学习学习（Learning）谢谢观赏2019-8-1882解决鸿沟的主要思路（续解决鸿沟的主要思路（续1）另一种代表性的解决方法是，美国德克萨斯大学奥斯汀分校（University of Texas at Austin）的Peter Stone在2007年获得IJCAI-07的“Computers and Thought Award”杰出青年大奖时所作的学术报告 Peter Stone. Learning and multiagent reasoning for aut
42、onomous agents. In: Proceedings of 2007 International Joint Conference on Artificial Intelligence (IJCAI-07), pp.13-30. 谢谢观赏2019-8-1883解决鸿沟的主要思路（续解决鸿沟的主要思路（续2）建立完全自主的完全自主的Agents（Complete autonomous agents），这些Agents具有高度的鲁棒性和灵活性，它们可感知环境，进行高层认知和决策，在环境中进行自主执行，即具有学习、交互、组合及合作等能力。他认为这种研究方法可分为两条基本路线：基本算法研究
43、基本算法研究，主要包括机器学习、多Agents系统（MAS）；应用研究应用研究，主要包括实现面向特定的复杂环境的完全自主Agents，以及从面向特定应用的自主Agents实现中总结发现普遍规律。谢谢观赏2019-8-1884解决鸿沟的主要思路（续解决鸿沟的主要思路（续3）美国华盛顿大学的Pedro Domings教授提出的马尔可夫逻辑网络（Markov Logic Networks）将谓词逻辑与统计学习方法有机地结合起来可填补AI中存在的高层与底层之间的鸿沟谢谢观赏2019-8-188513.11.3 完全自主完全自主Agent的关键技术的关键技术Peter Stone还指出，自从19
44、83年Tom Mitchell获得“Computers and Thought Award”杰出青年大奖并做了关于机器学习的学术报告后，从机器学习的观点来看，面向分类和预测的有监督学习（Supervised learning）方法得到了极大发展，并涌现出很多通用的工具包。同时，面向数据聚类的无监督学习（Unsupervised learning）方法也取得了很大进展。然而，从自主Agents的观点来看，最近出现的增强学习（Reinforcement learning）似乎更加重要，因为增强学习在很多序列决策问题中能够自主收集所需要的训练数据，学习到将状态映射为行为的策略，并从延迟奖赏中（Del
45、ayed reward）学习如何选择正确的行为，它实现了探索（Exploration）与开发（Exploitation）之间的权衡。谢谢观赏2019-8-188613.11.4 完全自主完全自主Agent的主要应用的主要应用Peter Stone给出了当前完全自主Agents的四个主要应用领域，分别是：足球机器人（Robot soccer）无人驾驶车辆（Autonomous vehicles）拍卖Agents（Bidding agents）自主计算（Autonomic computing）。其中，机器人足球和无人驾驶车辆是属于“物理Agents”（Physical agents），而
46、拍卖Agents和自主计算则属于“软件Agents”。这些应用充分展示了机器学习与多Agents推理的紧密结合，它涉及自适应及层次表达、分层学习、迁移学习（Transfer learning）、自适应交互协议、Agent建模等关键技术。谢谢观赏2019-8-1887课外阅读论文（可选课外阅读论文（可选12篇）：篇）：Wooldridge M, Jennings N R. Intelligent agents: theory and practice. Knowledge Engineering Review, 1995, 10(2): 115-152Jennings N R, Sycara
47、K, Wooldridge M. A roadmap of agent research and development. Autonomous Agents and Multi-Agent Systems. Boston: Kluwer Academic Publishers, 1998, 275-306Peter Stone. Learning and multiagent reasoning for autonomous agents. In: Proceedings of 2007 International Joint Conference on Artificial Intelli
48、gence (IJCAI-07), pp.13-30谢谢观赏2019-8-1888 其它值得研读的论文（可选）：其它值得研读的论文（可选）：Intelligent agents: theories, architectures, and languages. Mobile software agents: an overview.A mobile agent based service architecture for Internet telephony.A mobile agent-based advanced service architecture for wireless Internet telephony: design, implementation, and evaluation.Intelligent agents on the Web: a review. 【注】：上述论文一般均可通过google搜索到。谢谢观赏2019-8-18欢迎批评指正，谢谢！89谢谢观赏2019-8-18

展开阅读全文