湖南大学人工智能课件4.pptx

上传人（卖家）：三亚风情

文档编号：2823670

上传时间：2022-05-29

格式：PPTX

页数：29

大小：1.87MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

22 文币

交易提醒：下载本文档，相应价格的文币将全额进入上传人（卖家）的账号。立即下载优惠套餐（点此详情）

【下载声明】
1. 本站全部试题类文档，若标题没写含答案，则无答案；标题注明含答案的文档，主观题也可能无答案。请谨慎下单，一旦售出，不予退换。
2. 本站全部PPT文档均不含视频和音频，PPT中出现的音频或视频标识（或文字）仅表示流程，实际无音频或视频文件。请谨慎下单，一旦售出，不予退换。
3. 本页资料《湖南大学人工智能课件4.pptx》由用户（三亚风情）主动上传，其收益全归该用户。163文库仅提供信息存储空间，仅对该用户上传内容的表现方式做保护处理，对上传内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知163文库（点击联系客服），我们立即给予删除！
4. 请根据预览情况，自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器，压缩文件请下载最新的WinRAR软件解压。

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 湖南大学人工智能课件

资源描述：: 1、第四章第四章超越经典的搜索超越经典的搜索内容提要局部搜索算法不确定动作的搜索使用部分可观察信息的搜索联机搜索在许多最优化问题中，我们不是要寻找到达目标状态的路径，而是找到目标状态本身。N皇后问题：局部搜索算法：从单个当前结点出发，通常只移动到它的邻近状态而不保留搜索路径优点：很少的内存能在很大的或者无限的状态空间中找到合理的解缺点?依据初始状态，得到局部最大值h=直接或者间接相互攻击的皇后对数h=17(左图)h=1(右图)局部极小值爬山法不完备，随机法效率低，考虑结合两者产生了模拟退火搜索基本思想：允许算法向坏的方向移动以摆脱局部最大值，但这种移动随着时间的推移概率逐步下降如果时间下降
2、得足够的慢，那么模拟退火算法找到一个全局最优值的概率接近于1随机产生k个状态，然后每一步从所有的后继状态中选择k个最佳的后继状态直到找到目标状态。(内存中保留K个状态)随机束搜索：不是找到k个最佳，而是随机找到k个后继状态，随机概率与状态值成正比。一个后继状态由两个父状态决定以k个随机产生的状态开始(population)一个状态表示成一个字符串定义一个健康度量函数用来评价状态的好坏程度通过选择，交叉，突变的操作产生下一轮状态健康度量函数: 非冲突的皇后数量(min = 0, max = 8 7/2 = 28) 24/(24+23+20+11) = 31%,23/(24+23+20+11)
3、= 29%样本被选择繁衍后代的概率正比于它的健康度函数值发生交叉操作的概率需要预先设定，交叉位置随机产生发生突变操作的概率需要预先设定，通常远小于交叉概率环境是完全可观察的和确定的可以知道任何动作序列之后达到的状态环境是部分可观察或者是不确定的无法准确预知未来状态需根据未来感知信息制定相应的行为例子：真空洗尘器世界的不稳定行为在一块脏区域洗尘可以使该区域干净，有时也会清洁邻近区域在干净区域洗尘可能是该区域弄脏Suck when state=1If state=5 then right,suckElse do nonthing或结点必须选择行动在用圆圈表示的与结点上必须处理所有后继解用粗黑线标出
4、Q: LOOPQ: LOOP什么意思？什么意思？Agent 感知不到任何信息，称为无传感问题，也称相容问题无传感问题是可解的还是无解的？可解！真空吸尘器世界无传感问题的可解性：初始状态：1，2，3，4，5，6，7，8“向右”操作后:2,4,6,8“洗尘”操作后4,8“向左”操作后1,7“洗尘”操作后目标状态7在信念状态解无观察信息的问题无观察信息问题P的定义信念状态：包含物理状态中每个可能的集合，假定N个物理状态，最多有2N个信念状态初始状态：所有物理状态的集合行动：转移模型：对于确定行动对于不确定行动目标测试：信念状态中的所有物理状态都满足目标状态路径开销：假定所有状态下一个行动的开销相同)
5、()(sACTIONbACTIONPbs),(: ),(bsasRESULTssabRESULTbP且),(abRESULTbPbs256个可能的信念状态只有12个可达；初始状态出发的行动序列S,L,S与R,L,S达到相同的信念状态5,7如果一个行动序列是信念状态b的解，那么它也是b的任何子集的解真空吸尘器世界问题的局部感知：位置传感器和局部垃圾传感器例如：状态1的可观察信息percept(s)=A,dirty一个信念状态到另一个信念状态的特定行动分三阶段发生：预测阶段:给定信念状态b和行动a，预测信念状态观察预测阶段:确定预测信念状态中可观察到的感知信息o: 更新阶段：根据每个可能的感知信息
6、得到信念状态),(abPREDICTb 且)(:)(bssPERCEPToobPERCEPTSPOSSIBLE且)(:),(bssPERCEPTosobUPDATEboSuck,Right,if Bstate=6 then Suck else 部分可观察环境中的问题求解Agent形式化，搜索算法，执行解行动解是一个条件规划不是一个序列 if-then-elseAgent在完成行动和接收感知信息时维护自身的信念状态UPDATE(PREDICT(UPDATE(b,NSW),Move),NS)脱机搜索算法：在行动之间计算好完整的解决方案联机搜索算法：行动，观察环境，下一步行动竞争比=实际代价/最小代价30/20=1.5竞争比越小越好竞争比可以是无穷大，比如达到某些状态后无法达到目标状态(活动不可逆)可安全探索的状态空间：每个可达到的状态出发都有达到目标状态的行动，如迷宫问题，八数码问题局部搜索算法不确定动作的搜索使用部分可观察信息的搜索联机搜索QA？

展开阅读全文