决策理论与方法第03章12Oc11课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《决策理论与方法第03章12Oc11课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 决策 理论 方法 03 12 Oc11 课件
- 资源描述:
-
1、第第3章章 效用函数效用函数 引言 效用的定义和公理系统 效用函数的构造 风险与效用 货币的效用.3.1 引言引言 用定量化的方法研究决策问题: (1)自然状态不确定-用主观概率量化; (2)量化后果的价值-用“效用”来度量。 本章的研究目的就是解决后果的价值待定问题. 在定量评价可能的行动的各种后果时,会遇到两个主要问题:(1)无形后果(非数字量)。后果本身是用后果本身是用语言表述的语言表述的,可能没有任何合适的直接测量标度。 (2)即使有一个明确的标度(通常是钱)可以测量后果,按这个标度测得的量也还可能并不反映后果对决策人的真正价值决策人的真正价值。.实例实例 例3.1 考虑钱对同一个人的
2、价值。假设一个学生手头紧张,正好有机会挣100 元钱,但是所要做的是他相当讨厌的工作。根据他当时的经济状况和收入水平,他会认为 100元钱的实际价值足够大,所要做的工作即使是相当讨厌,他仍会去干;但是如果他先有了 10000元,要他为 100元钱去干这份让他讨厌的工作,他就很可能不干了。 .例例3.2 3.2 决策人面临图决策人面临图3.13.1中决策树所示中决策树所示的选择:的选择:(1)收入礼品1000元;(2)参与一次抽奖:有50%的机会得0元,50%的机会得2500元。礼品抽奖图3.1 例3.2的决策树0.50.5250001.010001a2a.分析:分析: 抽奖的期望值有1250元
3、,大于礼品的确定性收入1000元,一定有一部分人会选这确定性的1000元的收入;(因为对宁可选择礼品,即确定性的1000元的人而言,抽奖的期望值虽大,风险也大,实际价值还不如保险的1000元) 有的人则认为礼品不如抽奖,因为抽奖提供了获得2500元的机会。图3.1作为商业、经营中实际问题的数学模型有着普遍意义。. 由上面两个例子可知:在进行决策分析时,存在如何描述或表达后果对决策人的实际价值,以便反映决策的人心目中各种后果的偏好次序偏好次序(preference order)的问题。 偏好次序是决策人的个性与价值观的反映,与决策人所处的社会地位、经济地位、文化素养、心理和生理(身体)状态有关。
4、.如何来量化如何来量化“偏好偏好”? 贝努利(Daniel Bernoulli)在1738年就指出,若一个人面临决策问题,也就是如何从给定行动集合中作选择,如果这个人知道将来的自然状态以及相关的概率,则应选择对各种可能后各种可能后果的偏好的期望值最高果的偏好的期望值最高的行动。 “效用效用”(utility)来量化偏好3.2 3.2 效用的定义和公理系统效用的定义和公理系统.3.2.1 3.2.1 效用的定义效用的定义1. 基本概念与符号(1) 严格序严格序“ ” (或者记作aPb)的含义是“a优于b”严格序满足两个性质:传递性传递性:若 , 且 ,则必有非对称性非对称性:若 且 ,则不可能有
5、ca ba cb ba Acba,ba Aba,ab . 无差异“” ab(或记作aIb)的含义是“a无差异于b” 。 无差异关系满足传递性、对称性和自反性,即 传递性:若 ,且 ab,bc则ac ; 对称性:若 且ab,则有ba ; 自反性: 。 Acba,Aba,aaAa,. 弱序“ ” a b(或记作 aRb)的含义是“a 不劣于b ”,亦即 a 优于或者无差异 于 b 。 弱序 满足连通性、传递性、与严格优于 和无差异的一致性。 . 连通性亦称可比性: 对 , a b或b a或两者同时成立。 传递性: ,若a b且b c,则 a c ; 与无差异的一致性: 当且仅当 a b且b a ;
6、 与严格优于 的一致性:a b 当且仅 当 a b且非b a。因此 是最基本的次序关系。 Ab,a Ac , b ,a ba. 展望(prospect) 展望或称预期,指决策的可能的前景,即各种后果及后果出现的概率的组合,记作P :rrcpcpcpP,;,;,2211. 在例3.2的决策问题中,后果集C=1000, 2500, 0,采取行动a1和a2时的展望分别是 P1= 和 P2=。 展望既考虑各种后果ci,又考虑了各种后果出现的概率( 客观概率pi或主观概率i ),全面地描述了在决策问题中采取某种行动的可能前景。. 以上所述的展望是简单展望,有时会遇到复合展望。 例如,在例3.2中,某个决
7、策人认为采取行动 a1 或 a2 的结果无差异,拿不定主意选a1好还是选a2好,此人可能会通过抛硬币来决定:出现正面选a1,出现反面选a2。这时的展望P3就是复合展望:213, 5 . 0;, 5 . 0PPP.复合展望的一般形式为: , 其中为简单展望。 ssPPP,;,1111siisjcpcpcpPrjrjjj, 1,;,;,2211. 复合展望可以简化成简单展望 其中 所有展望P,包括所有可能的简单展望和复合展望的集合记作 。 确定性后果是展望的特殊情况,因此在不至于引起误解时,出于语言习惯,我们对后果与展望不作严格区分。 ,;,;,2211rrcpcpcpPrippskkiki, 1
8、,1.(5)抽奖与确定当量 由机会点和该机会点发出的n个机会枝的概率及相应后果构成的图形称为抽奖抽奖( (lottery) ),抽奖又称彩票,记作 。 图3.3中的右半部分就是最简单的只有两个机会枝的抽奖。在一般情况下,有n种自然状态,就有n个机会枝和同样数量的后果。nncpcpcpL,;,;,2211.图3.3 抽奖与确定当量 p11-p1c1c21.0cl.抽奖与展望的区别抽奖与展望的区别 展望P中包含决策问题所有可能的后果,其中有些后果发生的概率为0; 抽奖L中只包含采取某种行动时所出现的那些后果。 .若决策人认为某个确定性后果 与抽 奖 无差异,即 则称确定性后果 为抽奖 的确定当量(
9、certainty equivalent)。图3.3所示为抽奖 与确定当量 。 lc nnc ,p;c ,p;c ,pL2211lcnncpcpcp,;,;,2211nncpcpcp,;,;,2211lclc2111),1 ( ;,cpcpL.(2) 效用的定义(A) 定义定义3.1 在集合 上的实值函数u,若它和 上的优先关系 一致,即:若 , P1 P2当且仅当u( )u( ).则称 u 为效用函数。 把效用函数定义在展望集 上而不是定义在后果集C上,是为了使效用函数能够反映决策人对风险的态度。21,PP1P2P.定义3.1给出的效用函数不一定存在。 Von Neumann-Morgens
10、tern, 1944年给出效用的存在性公理,又称理性行为公理。公理3.1 连通性(connectivity)又称可比性(comparability) 在 上的优先关系是连通的,即如果 ,则 ,或者 ,或者 。 3.2.2 3.2.2 效用存在性公理效用存在性公理 21,PP21PP 21 PP12PP .公理3.2 传递性 (transitivity) 在 上的优先关系是传递的,即如果 , 且 ,则 。公理3.3 替代性 若 , 且 0 1,则必有 或 者 表 达 成 : 若 , , 则 321,PPP21PP32PP 31PP321,PPP3231)1 ()1 (PPPP21,PP21PP0
11、12121)1 ()1 (PPPP21PP .公理3.4 连续性(偏好的有界性) 若 , ,则存在 ,使321,PPP321PPP0131231)1 ()1 (PPPPP. 公理3.1要求集合 中的元素具有成对可比性,即决策人能够判定 中任何两个元素之间的优劣。 公理3.1和公理3.2合称次序性公理,满足次序性公理的集合 是全序集。 全序集合 中的元素可以根据决策人的偏好排列优先次序。. 公理3.3表明两个有序的展望各有相同的比例 被相等的量 替代后,优先关系不变。 公理3.3的另一种表达方式是说,二种后果中,决策人所偏好的后果出现可能性较大的情况是决策人所喜爱的。)1 (3)1 (P. 公理
12、3.4是说,没有无穷好的和无穷差的酬报。因为由式的左半部分 可知, 不是无穷劣,即 u( ) ,否则将有 u u( ), 式的左半部分不可能成立。 同样的,由式(3.5)的右半部分可知, 不是无穷优,即 。231)1 (PPP3P3P3)1 (P)1 (3P1P)(1Pu. 或许有人会说,如果决策问题的某个后果是决策人死亡,难道这种后果的效用还不是无穷劣吗?我们说, 即使是死亡,亦不至于是无穷劣,看下面的例子。3P.例3.3 一个人在街道的一侧,为了到另一侧办事或到另一侧的商店购物,当地及附近没有过街天桥和地道,就必须过马路。以往的统计资料显示,因过马路发生交通事故,造成死亡的概率约在 数量级
13、。据此可以作过马路问题的决策树如图3.4所示。810. 图3.4 过马路问题的决策树 不过马路过马路10-81-10-8死亡达到目的1.0无法到达目的地. 若后果死亡的效用为无穷劣( ),则无论死亡的概率多小,只要不为0,过马路的期望效用都将是 ,小于不过马路的期望效用,也就是说不能过马路;实际上很少有人因为过马路存在死亡的威胁而放弃过马路的。所以即使是死亡,亦不至于是无穷劣。.例3.4 为了防止被狗咬伤后得狂犬病,可以注射狂犬病疫苗,注射狂犬病疫苗的费用是20元。设某地区因得狂犬病而死亡的概率是百万分之一,则可作注射狂犬病疫苗问题的决策树如图3.5。.图3.5 注射狂犬病疫苗的决策树 注射疫
14、苗不注射10-6110- 6死亡01.0-20元. 如果后果死亡是无穷劣,效用是 ,则任何人都应该去接种狂犬病疫苗。然而大部分人都没有去接种。对不去接种狂犬病疫苗的人,即使货币的价值是线性的,死亡的价值小于二千万元;若考虑货币的边际价值的递减性,死亡的价值更小,远非有些人所设想的负无穷。. 例3.5 Allais悖论(Allais paradox) Allais, 1953年提出如图3.6情况A所示的问题,请效用理论权威 Savage 回答: 0.89$500,0000.11b10情况B0. 900$2,500,0000.10b20.890. 01$500,0000$2,500,0000.10
15、$500,0001.00情况A2a1a.Savage的回答: 对情况A,由于a1的后果不存在任何风险,可以稳稳当当得到$500,000;而选择a2有1%的概率得0,因此选择a1。 对情况B,由于这时无论选择哪一种,都有很大的可能性(89%、90%)得 0 ;而10%的机会得$2,500,000,显然优于11的机会得$500,000。于是,得到的回答是在情况B下,选择b2。.Allais指出,上述选择存在偏好的不一致性 作如下替换 在情况A中,我们在a1以0.89的概率获得$0取代获得$500,000;同时在a2中同样以0.89的概率获得$0取代获得$500,000。于是,就成了情况B中的b1和
展开阅读全文