囚徒困境及其启示课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《囚徒困境及其启示课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 囚徒 困境 及其 启示 课件
- 资源描述:
-
1、囚徒困境囚徒困境小组成员:王嘉瑶小组成员:王嘉瑶 王洁霞王洁霞 王孟佳王孟佳 王晓斌王晓斌什么是博弈论?什么是博弈论?博弈论又被称为博弈论又被称为对策论对策论(Game TheoryGame Theory)既是现代数学的一个新分)既是现代数学的一个新分支,也是运筹学的一个重要学科。支,也是运筹学的一个重要学科。博弈论主要研究博弈论主要研究公式化的激励结构间的相互作用公式化的激励结构间的相互作用。是研究具有斗。是研究具有斗争或竞争性质现象的数学理论和方法。争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体博弈论考虑游戏中的个体的的预测行为和实际行为预测行为和实际行为,并研究它们的,并研究它
2、们的优化策略优化策略。生物学家使用。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈理论来理解和预测进化论的某些结果。基本概念中包括局中人、行动、信息、策略、收益、均衡和结果基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。果被统称为博弈规则。类型类型(1)1)合作博弈合作博弈研究人们达成合作时如何分配合作得到的收益,即收研究人们达成合作时如何分配合作得到的收益,即收益分配问题。益分配问题。(2)(2)非合作博弈非合作博弈研究人们在利益相互影响的局势中
3、如何选决策使自研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。己的收益最大,即策略选择问题。(3)(3)完全信息完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。(4)(4)静态博弈和动态博弈静态博弈和动态博弈静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。者不知道先行动者的策略。动态博弈:指双方
4、的的行动有先后顺序并且后行动者可以知道先行动动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。者的策略。要素要素1)局中人局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为一个局中人。只有两个局中人的博弈现象称为“两人博弈两人博弈”,而多而多于两个局中人的博弈称为于两个局中人的博弈称为“多人博弈多人博弈”。2)策略策略:一局博弈中,每个局中人都有选择实际可行的完整的行:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一动方案,即方
5、案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。方案,称为这个局中人的一个策略。3)得失得失:一局博弈结局时的结果称为得失。每个局中人在一局博:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的局中人的“得失得失”是全体局中人所取
6、定的一组策略的函数,通常是全体局中人所取定的一组策略的函数,通常称为支付(称为支付(payoff)函数。)函数。4)对于博弈参与者来说,存在着一对于博弈参与者来说,存在着一博弈结果博弈结果。5)博弈涉及到均衡博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是此时我们就说,
7、该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。一稳定的博弈结果。“囚徒困境囚徒困境”是是1950年美国兰德公司提出的博弈论模型。年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚
8、徒无法揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。信任对方,因此倾向于互相揭发,而不是同守沉默。警方怀疑他们作案,但并没有掌握他们作案的确凿证据,于是明确地分别告诉2名嫌疑人:对他们犯罪事实的认定及相应的量刑,完全取决于他们自己供认与否。有2个涉嫌共同作案偷窃的嫌疑人A和B被带进警察局。假定警方对2名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到对方的选择。v如果一方与警方合作,坦白所做违法之事,而另一方抵赖,招认方将无罪释放,另一方则会被判重刑8年;v如果双方都与警方合作共同招认,各被判刑5年;v如果双方均不认罪,因为警察找不到
9、其他证明他们违法的证据,则判刑1年。A B 不坦白不坦白 坦白坦白不坦白不坦白A:判刑:判刑1年年B:判刑:判刑1年年A:无罪释放:无罪释放B:判刑:判刑8年年坦白坦白A:判刑:判刑8年年B:无罪释放:无罪释放A:判刑:判刑5年年B:判刑:判刑5年年现实中,现实中,基于人是理性的这一前提,无论同伙是否坦白,自基于人是理性的这一前提,无论同伙是否坦白,自己坦白总是比不坦白好。两个人这样一算计,己坦白总是比不坦白好。两个人这样一算计,最好的结果都最好的结果都是选择坦白,各判刑是选择坦白,各判刑5年。年。然而然而实际上,如果实际上,如果两人都抵赖,两人都抵赖,那么都那么都会无罪释放会无罪释放,显然这
10、,显然这个结果是最好的。但人个结果是最好的。但人在在理性算计排除了这一结果。理性算计排除了这一结果。这个故事讲得就是这个故事讲得就是囚徒困境囚徒困境,是在,是在1950年,由就职于兰德公年,由就职于兰德公司的梅里尔司的梅里尔弗拉德(弗拉德(Merrill Flood)和梅尔文)和梅尔文德雷希尔德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔)拟定出相关困境的理论,后来由顾问阿尔伯特伯特塔克(塔克(Albert Tucker)以囚徒方式阐述,并命名为)以囚徒方式阐述,并命名为“囚徒囚徒困境困境”。u 囚徒困境的囚徒困境的核心理念核心理念是:博弈全输,合作双赢,怀疑或不
展开阅读全文