人工智能知识表示与推理博弈树搜索课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《人工智能知识表示与推理博弈树搜索课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 知识 表示 推理 博弈树搜索 课件
- 资源描述:
-
1、人人 工工 智智 能能Artificial Intelligence(AI)2023-2-42.4 博弈问题的搜索技术博弈问题的搜索技术 2.4.1 博弈问题的表达博弈问题的表达 2.4.2 极大极小搜索过程极大极小搜索过程 2.4.3 -剪枝法剪枝法2023-2-42.4.1 博弈问题的表达博弈问题的表达 博弈博弈是一类具有竞争性的智能活动是一类具有竞争性的智能活动双人博弈双人博弈:即两位选手对垒,轮流依次走步,:即两位选手对垒,轮流依次走步,其中任何一方都完全知道对方过去已经走过的其中任何一方都完全知道对方过去已经走过的棋步和今后可能的走步,其结果是一方赢棋步和今后可能的走步,其结果是一方
2、赢(而另而另一方则输一方则输),或双方和局,或双方和局2023-2-4博弈的例子博弈的例子:一字棋一字棋 跳棋跳棋 中国象棋中国象棋 围棋围棋 五子棋五子棋2023-2-4双方的智能活动,任何一方都不能单独控制双方的智能活动,任何一方都不能单独控制博弈过程,而是由双方轮流实施其控制对策博弈过程,而是由双方轮流实施其控制对策的过程的过程博弈的特点博弈的特点:2023-2-4如何根据当前的棋局,选择对自己最有利的如何根据当前的棋局,选择对自己最有利的一步棋一步棋?!?!人工智能中研究的博弈问题人工智能中研究的博弈问题:2023-2-4用博弈树来表示,它是一种特殊的与或图。节点用博弈树来表示,它是一
3、种特殊的与或图。节点代表博弈的格局(即棋局),相当于状态空间中代表博弈的格局(即棋局),相当于状态空间中的状态,反映了博弈的信息。的状态,反映了博弈的信息。与节点、或节点与节点、或节点隔层交替出现隔层交替出现博弈问题的表示博弈问题的表示:2023-2-4假设博弈双方为:假设博弈双方为:MAX和和MIN在博弈过程中,规则是双方轮流走步。在博弈在博弈过程中,规则是双方轮流走步。在博弈树中,相当于博弈双方轮流扩展其所属节点树中,相当于博弈双方轮流扩展其所属节点为什么为什么与节点与节点、或节点或节点隔层交替出现隔层交替出现?2023-2-4从从MAX方的角度来看方的角度来看:所有所有MIN方节点都是方
4、节点都是与节点与节点理由理由:因为因为MIN方必定选择最方必定选择最不利于不利于MAX方的方式来方的方式来扩展节点,只要扩展节点,只要MIN方节点的子节点中有一个方节点的子节点中有一个对对MAX方不利,则该节点就对方不利,则该节点就对MAX方不利,故方不利,故为为“与节点与节点”MIN好招好招2023-2-4从从MAX方的角度来看方的角度来看:所有属于所有属于MAX方的节点都是方的节点都是“或节点或节点”理由理由:因为扩展因为扩展MAX方节点时,方节点时,MAX方可选择扩展最方可选择扩展最有利于自己的节点,只要可扩展的子节点中有有利于自己的节点,只要可扩展的子节点中有一个对已有利,一个对已有利
5、,则该节点就对已有利则该节点就对已有利MAX好招好招2023-2-4总之总之从从MAX方来说,与节点、或节点交替出现;反之,方来说,与节点、或节点交替出现;反之,从从MIN方的角度来看,情况正好相反方的角度来看,情况正好相反2023-2-4在博弈树中,先行一方的初始状态对应着树的在博弈树中,先行一方的初始状态对应着树的根根节点节点,而任何一方获胜的最终格局为目标状态,而任何一方获胜的最终格局为目标状态,对应于树的对应于树的终叶节点终叶节点(可解节点或本原问题)(可解节点或本原问题)但是,从但是,从MAX的角度出发,所有使的角度出发,所有使MAX获胜的获胜的状态格局都是本原问题,是可解节点,而使
6、状态格局都是本原问题,是可解节点,而使MIN获胜的状态格局是不可解节点获胜的状态格局是不可解节点2023-2-4例例 Grundy博弈:博弈:分配物品的问题分配物品的问题如果有一堆数目为如果有一堆数目为N的钱币,由两位选手轮流进的钱币,由两位选手轮流进行分配,要求每个选手每次把其中某一堆分成数行分配,要求每个选手每次把其中某一堆分成数目目不等不等的两小堆,直至有一选手不能将钱币分成的两小堆,直至有一选手不能将钱币分成不等的两堆为止,则判定这位选手为输家不等的两堆为止,则判定这位选手为输家2023-2-4用数字序列加上一个说明来表示一个状态:用数字序列加上一个说明来表示一个状态:(3,2,1,1
7、,MAX)数字序列数字序列:表示不同堆中钱币的个数:表示不同堆中钱币的个数说明说明:表示下一步由谁来分,即取表示下一步由谁来分,即取MAX或或MIN2023-2-4现在取现在取N7的简单情况的简单情况,并由,并由MIN先分先分 注注:如果:如果MAX走红箭头的分法,必定获胜走红箭头的分法,必定获胜所有可能的分法所有可能的分法(7,MIN)(6,1,MAX)(5,2,MAX)(4,3,MAX)(5,1,1,MIN)(4,2,1,MIN)(3,2,2,MIN)(3,3,1,MIN)(4,1,1,1,MAX)(3,2,1,1,MAX)(2,2,2,1,MAX)(2,2,1,1,1,MIN)(3,1,
8、1,1,1,MIN)(2,1,1,1,1,1,MAX)2023-2-4对于比较复杂的博弈问题,只能模拟人的思维对于比较复杂的博弈问题,只能模拟人的思维“向前看几步向前看几步”,然后作出决策,选择最有利自,然后作出决策,选择最有利自己的一步。即己的一步。即只能给出几层走法,然后按照一定只能给出几层走法,然后按照一定的估算办法,的估算办法,决定走一好招决定走一好招2023-2-42.4.2 极大极小过程极大极小过程 对于复杂的博弈问题,要规定搜索深度与时间,对于复杂的博弈问题,要规定搜索深度与时间,以便于博弈搜索能顺利进行以便于博弈搜索能顺利进行假设由假设由MAX来选择走一步棋,问题是:来选择走一
9、步棋,问题是:MAX如何来选择一步好棋如何来选择一步好棋?2023-2-4 对于每一格局(棋局)给出(定义或者倒推)对于每一格局(棋局)给出(定义或者倒推)一个静态估价函数值。值越大对一个静态估价函数值。值越大对MAX越有利,反越有利,反之越不利之越不利极大极小过程的基本思路极大极小过程的基本思路:2023-2-4 对于给定的格局,对于给定的格局,MAX给出可能的走法,然给出可能的走法,然后后MIN对应地给出相应的走法,这样重复若干次,对应地给出相应的走法,这样重复若干次,得到一组端节点(必须由得到一组端节点(必须由MIN走后得到的,由走后得到的,由MAX下的棋局)。这一过程相当于节点扩展下的
10、棋局)。这一过程相当于节点扩展注注:博弈树深度或层数一定是偶数:博弈树深度或层数一定是偶数2023-2-4 对于每一个端节点,计算出它们的静态估价函对于每一个端节点,计算出它们的静态估价函数,然后自下而上地逐层计算倒推值,直到数,然后自下而上地逐层计算倒推值,直到MAX开始的格局。在开始的格局。在MIN下的格局中取估值的最小值,下的格局中取估值的最小值,在在MAX下格局中取估值的最大值下格局中取估值的最大值 取估值最大的格局作为取估值最大的格局作为MAX要走的一招棋要走的一招棋2023-2-4例例:向前看一步的两层博弈树向前看一步的两层博弈树 2023-2-4定义静态函数定义静态函数e(P)的
11、一般原则的一般原则:0MAXMIN()0 0MAX MINe P 占优,不利势均力敌不利,占优2023-2-4 OPEN:存放待扩展的节点,此时为队列,存放待扩展的节点,此时为队列,即以宽度优先的策略扩展节点即以宽度优先的策略扩展节点 CLOSED:存放已扩展的节点,此时为堆栈,存放已扩展的节点,此时为堆栈,即后扩展的节点先计算静态估价函数值即后扩展的节点先计算静态估价函数值 符号符号:2023-2-41、将初始节点、将初始节点 S 放入放入 OPEN 表中,开始时搜索表中,开始时搜索树树 T 由初始节点由初始节点 S 构成构成2、若、若 OPEN 表为空,则转表为空,则转53、将、将 OPE
12、N 表中第一个节点表中第一个节点 n 移出放入移出放入CLOSED 表的前端表的前端极大极小搜索过程极大极小搜索过程为为:2023-2-44、若、若 n 可直接判定为赢、输、或平局,则令对可直接判定为赢、输、或平局,则令对应的应的 e(n)=,-或或 0,并转,并转2;否则扩展;否则扩展 n,产生产生 n 的后继节点集的后继节点集 ni,将将 ni 放入搜索树放入搜索树 T 中中2023-2-4此时,若搜索深度此时,若搜索深度d ni 小于预先设定的深度小于预先设定的深度 k,则将则将 ni 放入放入OPEN表的末端,转表的末端,转2;否则,;否则,ni 达到深度达到深度k,计算计算e(ni)
13、,并转并转2(续)(续)2023-2-45、若、若CLOSED表为空,则转表为空,则转8;否则取出;否则取出CLOSED表中的第一个节点,记为表中的第一个节点,记为 npOpen为空,即已经扩展完节点为空,即已经扩展完节点步步22023-2-46、若若 np 属于属于MAX层,且对于它的属于层,且对于它的属于MIN层层的子节点的子节点 nci 的的 e(nci)有值,则:有值,则:e(np)=max nci 某一个节点属于某一个节点属于MAX的含义的含义是该节点等待是该节点等待MAX来扩展来扩展2023-2-4(续)(续)若若 np 属于属于MIN层,且对于它的属于层,且对于它的属于MAX层的
展开阅读全文