书签 分享 收藏 举报 版权申诉 / 20
上传文档赚钱

类型人教B版高中数学选修4-9课件-马尔可夫型决策课件1.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4365760
  • 上传时间:2022-12-02
  • 格式:PPTX
  • 页数:20
  • 大小:1.67MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《人教B版高中数学选修4-9课件-马尔可夫型决策课件1.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    人教 高中数学 选修 课件 马尔可夫型 决策 下载 _人教B版_数学_高中
    资源描述:

    1、*第六讲马尔可夫型决策数学人教B版高中选修4-9风险与决策教学目标知识与能力知识与能力 熟悉马尔可夫型决策,能够独立地对马尔可熟悉马尔可夫型决策,能够独立地对马尔可夫型决策进行某一时间段和短期的风险决策夫型决策进行某一时间段和短期的风险决策.过程与方法过程与方法 通过对普通风险决策的回顾,对马尔可夫通过对普通风险决策的回顾,对马尔可夫链做进一步理解,结合前面的风险型决策对比链做进一步理解,结合前面的风险型决策对比的学习马尔可夫型决策的学习马尔可夫型决策.情感态度与价值观情感态度与价值观 通过与普通风险决策比较的学习,使学生能通过与普通风险决策比较的学习,使学生能够迅速的接受和理解马尔夫型决策够

    2、迅速的接受和理解马尔夫型决策.重点:重点:转移概念矩阵,平均收益矩阵转移概念矩阵,平均收益矩阵.难点:难点:马尔可夫型决策案例分析马尔可夫型决策案例分析.教学重难点教学重难点案例案例4 某工厂的一台自动加工机有某工厂的一台自动加工机有2种工作状态种工作状态:正正常状态和故障状态常状态和故障状态.在每个整数钟点的起始时刻检查在每个整数钟点的起始时刻检查机器的工作情况机器的工作情况,若机器处于正常状态若机器处于正常状态,则让它继则让它继续工作续工作;若机器处于故障状态若机器处于故障状态,则对他进行检修则对他进行检修.假设假设处于正常状态的机器处于正常状态的机器,在一小时后发生故障的概率在一小时后发

    3、生故障的概率为为0.05,对于故障机器有,对于故障机器有2种检种检案例分析修方案可供选择,修方案可供选择,一种是加急检修,在一种是加急检修,在一小时内一小时内排除故排除故障的概率为障的概率为0.9;一种是一种是常规检修常规检修,在一小时内排除故障,在一小时内排除故障的概率为的概率为0.6.已知这台机器正常工作一小时可已知这台机器正常工作一小时可收益收益10元,加急检元,加急检修修1小时费用为小时费用为9元,常规检修一小时费用为元,常规检修一小时费用为6元,若机元,若机器出现故障,该选择哪种方案?器出现故障,该选择哪种方案?先写出行动方案和可能状态先写出行动方案和可能状态 决策目标是使机器产生收

    4、益最大,可供选择的行动决策目标是使机器产生收益最大,可供选择的行动方案有:方案有:加急检修,加急检修,:常规检修常规检修.机器在任意时刻可能所处的状态:机器在任意时刻可能所处的状态:正常状态,正常状态,:故障状态故障状态.1d2d1h2h 机器在第机器在第n小时的工作状态小时的工作状态 与时间有关与时间有关,显然显然 是一个马尔可夫链是一个马尔可夫链,状态分布列随着状态分布列随着时间的变化也在不断变化时间的变化也在不断变化.普通风险决策分布列保持不变可表示为普通风险决策分布列保持不变可表示为nXnXhp1-p()P h1h2h行动方案行动方案d1 转移概率矩阵为转移概率矩阵为行动方案行动方案d

    5、2的转移概率矩阵为的转移概率矩阵为10.950.05P=,0.90.120.950.05P=,0.60.4然后写出状态转移矩阵然后写出状态转移矩阵 设定时间段设定时间段 ,则收益,则收益矩阵为矩阵为,1n n 1010,96Q 假设机器最开始为正常工作状态,假设机器最开始为正常工作状态,则初始分布则初始分布为为(0)(0)12(10),pp写出收益矩阵,初始分布写出收益矩阵,初始分布时刻时刻n的分布和时刻的分布和时刻n+1的分布的关系?的分布的关系?想一想想一想(1)(1)()()1212nnnnppppP在行动方案在行动方案d1下,时刻下,时刻1的分布的分布时刻时刻2的分布的分布(1)(1)

    6、12pp=(0.950.05)(2)(2)(1)(1)12121pp=ppP0.950.05=0.950.050.90.1=0.94750.0525时刻时刻n的分布为的分布为(n)(n)(0)(0)n12121npp=ppP0.950.05=0.950.050.90.1在行动方案在行动方案d2下,时刻下,时刻n的分布的分布(n)(n)(0)(0)n12122npp=ppP0.950.05=0.950.050.60.4 假设初始状态为正常状态,行动假设初始状态为正常状态,行动d1在时间段在时间段 内的平均收益为内的平均收益为行动方案行动方案d2在时间段在时间段 内的平均收益为内的平均收益为(0)

    7、(0)n1121n10Q(d,n)=ppP-90.950.0510=(10)0.90.1-9(0)(0)n2122n10Q(d,n)=ppP-60.950.0510=(10)0.60.4-6 ,1n n,1n n3写出平均收益矩阵写出平均收益矩阵 不设定初始情况不设定初始情况,则行动方案则行动方案d1在时间段在时间段 内的平均收益为内的平均收益为(0)(0)1120.95 0.0510(,).0.90.19nQ d npp 行动方案行动方案d2在时间段在时间段 内的平均收益为内的平均收益为(0)(0)2120.95 0.0510(,).0.60.46nQ d npp ,1n n,1n n 假设

    8、初始状态为正常状态,则两行动假设初始状态为正常状态,则两行动方案前方案前10个时间段平均收益为个时间段平均收益为时间段9.05009.20009.0258.92009.0018.82209.00008.76931,22,33,41 0,1 11(,)Q d n2(,)Q dn 最后,根据题目要求选择最大收益决策,最后,根据题目要求选择最大收益决策,当确定某一确定时刻当确定某一确定时刻n,在时间段在时间段 内内进行决策进行决策时时,这类这类问题是短期准则下的马尔可夫问题是短期准则下的马尔可夫型决策型决策,当在时间段内当在时间段内 进行决策时进行决策时,我们我们称为长期准则下的马尔可夫型决策称为长期准则下的马尔可夫型决策,这类这类问题问题将在下一节中讲将在下一节中讲.0,n0,The EndThe End

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:人教B版高中数学选修4-9课件-马尔可夫型决策课件1.pptx
    链接地址:https://www.163wenku.com/p-4365760.html
    晟晟文业
         内容提供者      个人认证 实名认证

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库