登陆注册
7742000000014

第14章 “重复囚徒困境”的游戏

其目的就是要研究在无限次数的“对局游戏”中人为什么要合作,人什么时候是合作的、什么时候又是不合作的,如何使别人与你合作。

一位美国科学院院士、著名的行为分析和国际关系专家罗伯特·艾克斯罗德搞了一场关于“重复囚徒困境”的游戏。

艾克斯罗德的游戏思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。在游戏中,有两个对策者,他们可以有两个选择:合作或背叛,每个人都必须在不知道对方选择的情况下,作出自己的选择。

艾克斯罗德邀请了来自经济界、心理学、社会学、政治学和数学领域的14位专家参与这一游戏。每个参加者每一步都要写出个体选择合作或不合作的程序,这个程序在作选择时可以利用对局的历史情况来分析,从而决定自己的策略。游戏双方的选择,放在一起就产生了四种可能的结果,即:

1.合作,合作;

2.合作,背叛;

3.背叛,合作;

4.背叛,背叛。

在这个游戏中,如果双方选择合作,双方都能得到较好的结果,即“对双方合作的奖励”为3分。如果一方合作而另一方背叛,那么,背叛者因为讨了对方的便宜,所以得到“对背叛的投机”5分。而合作者因为被对方占了便宜,只能得0分。如果双方都背叛,那么双方既没有占到便宜又似乎没有失去什么,所以都得到1分。

我们设想甲、乙两个程序在一起博弈,就出现这样的结果。

甲:合作(3)乙:合作(3)

甲:合作(0)乙:背叛(5)

甲:背叛(5)乙:合作(0)

甲:背叛(1)乙:背叛(1)

就这种情形看来,对双方来说最好的结果是选合作,总体得6分。如果一方选合作,一方选不合作,总体得5分。如果两人都选不合作,总体得2分。

竞赛是循环进行的,即每一个参赛程序都与其他程序相遇。按照事先宣布的竞赛规则,每一个参赛程序还要与自己对局,以及和一个“随机程序”相遇。所谓“随机程序”是指以相等的概率(50%)随机地选择“合作”或“背叛”。

艾克斯罗德要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两对局,以找出什么样的策略得分最高。

14个程序再加上一个“随机程序”彼此开始了第一轮游戏。

让我们来分析一下这个“重复困境游戏”。虽然对个体而言,最大的利益是得5分,但如果对局在多人间进行,而且次数未知,对策者就会意识到,当持续地采取合作并达成默契时,对策者就能持续地得3分,这是一个相对理想的结果;但如果持续地不合作的话,每个人就永远得1分。因此,就整个参赛程序而言,不可能得到高分。这样,合作就成为了这个游戏的优势策略。

在这个游戏中,参赛者提出了各种程序,根据程序的本意大致可分为“善良的”、“邪恶的”和“随意的”三类。所谓“善良”策略即是“以合作为主”的策略;而“邪恶”策略则是“以占便宜为主”的策略。

最后胜出的是一个称为“一报还一报”策略,它是所有提交程序中最简单,结果却是最好的。“一报还一报”这个程序的特点是,第一次对局采用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。

假设某人的策略是:第一次合作,以后只要对方不合作一次,他就永不合作。对这种对策者,当然合作下去是上策。假如有的人不管对方采取什么策略,他总是合作,那么总是对他采取不合作的策略得分最多。对于总是不合作的人,也只能采取不合作的策略。

为什么“一报还一报”这样一个简单的策略会打败其他学者绞尽脑汁写出来的复杂程序呢?

让我们再来反思一下“一报还一报”稳定成功的原因。简单地说,这个“以其人之道还治其人之身”的策略有着下面四个特点:

一、清晰性:以牙还牙,以眼还眼。以合作还合作,以背叛还背叛,使它容易被对方理解,从而引出长期的合作关系。

二、善良性:这种策略一开始便以善意和对方合作,也绝不会先背叛对方,这可防止它陷入不必要的麻烦。

三、报复性:如果对方背叛,下一次一定如法炮制,自动施以报复,决不原谅。报复性使对方试着背叛一次后就不敢再背叛;

四、宽容性:如果对方又主动恢复合作,要立刻与对方握手言欢,既往不咎,有助于重新恢复合作。

“一报还一报”策略是有关“囚徒困境”的最著名的也是被讨论最多的策略。它非常容易理解也非常容易被编成程序,更因为这个策略能引发人们的合作关系而著名。

“一报还一报”的成功可以说明它是一个很具适应性的规则:即它在很大范围内表现极佳。

有趣的是,“一报还一报”这个策略与单独某个策略相遇时,没有一次是赢了对方的,顶多是和对方打成平手。“一报还一报”策略从来没有一次在竞赛中比对方得更多的分!它总是让对方先背叛,而它自己背叛的次数也绝不比对方多。它的得分往往比对方少,至多与对方相等。但是,在与多样化的对手分别比赛之后,最后加起来的,它的总分仍然有可能是最高的。今天如果比赛的规则改变了,在单独比赛赢的人将得到所有的分数,输的为零分。那么“一报还一报”可能就没机会坐上冠军的宝座了。

“一报还一报”的成功部分是由于其他规则预料到它的存在并且被设计得与它很好相处。要和“一报还一报”很好相处就要求和它合作,这反过来就帮助了“一报还一报”规则。即使是那些想伺机占便宜而不被惩罚的规则,也很快向“一报还一报”规则道歉。

任何想占“一报还一报”便宜的规则最终将伤害自己。“一报还一报”从自己的不可欺负性中得到好处,这是因为遇到“一报还一报”的可能性是很大的。一旦相遇,“一报还一报”很容易被识别出来。一旦被识别出来,“一报还一报”的不可欺负性就显示出来。因此,“一报还一报”从它自己的清晰性中得到好处。

“一报还一报”放弃了占他人便宜的可能性。尽管这种机会有时是很有利可图的,但是在广泛的环境中,试图占便宜而引来的问题也多种多样。

在与“一报还一报”策略的接触中,如果一个规则用背叛试探是否可以占便宜,它就得冒被那些可激怒的规则报复的风险。如果双方的反击一旦开始,就很难使自己解脱。

最后,试图识别那些“随机”规则或者那些过分不合作的规则,并放弃与它们合作的努力,经常错误地导致放弃与其他一些规则的合作,而这些规则是可以被有耐心的规则,比如“一报还一报”这种规则挽救的。

当然,我们知道就有限的次数与对局者而言,“一报还一报”并不是最优策略,但却是整体得分最多的策略,它的成功在于它良好的适应性。

由于一个特定策略的有效性不仅取决于它自己的特性,而且取决于它要相遇的其他策略的特性。因此,单一竞赛的结果是不能最后说明问题的。

当第一轮的比赛结束后,艾克斯罗德把第一次的结果公开发表,并决定邀请更多的人再做一次游戏。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。第二轮比赛比第一轮有了一个更高的起点,因为每个人(程序)都已经从第一次比赛中成功的策略中获取经验,因此人们更期望它的结果对于指导下一轮的成功更有帮助。

令人意外的是第二轮胜出的仍然是“一报还一报”。但与第一轮不同的是,这一轮比赛由于绝大部分人都知道“一报还一报”的胜出事实,最有趣而令人惊奇的是,许多人在“一报还一报”原则的基础上试图改进与优化它,不过,令人惊奇的是这些提交的复杂程序没有一个能够表现得像原本的“一报还一报”那样好。既能占便宜又不会付出太大的代价是第二轮竞赛中任何一个参赛程序都想实现而没能够实现的。

“一报还一报”显然是经济、实用而且非常成功的策略。

第二轮竞赛不仅验证了第一轮比赛分析中得出的结论和发现,还使参赛者从第一轮竞赛的经验中吸取了自己的教训,但不同的人得到的教训不同。

同类推荐
  • 领导十诫

    领导十诫

    当领导是一门艺术。做一个好领导,干一番轰轰烈烈的事业,必须具备清醒的头脑。成功的领导者都知道,领导之路漫长而不平坦,尤其有几处是特别要留心的要紧处。本书从领导修养入手,从十大方面列举领导者人生事业中的重要关坎,从而帮助领导者提升自身的素质,走好自己的人生路。
  • 管理的戒律、经营的戒律、营销的戒律(全集)

    管理的戒律、经营的戒律、营销的戒律(全集)

    本书汇集了最经典的管理学、经营学和营销学定律,这些定律囊括了企业管理的方方面面,内容涵盖员管理的授权、沟通、分享,创新管理,危机管理,战略管理,营销管理,生产管理等等,通俗易懂,简单实用。这些著名的思想精华和智慧,帮助读者更快抵达事业成功的彼岸。
  • 任正非:管理的真相

    任正非:管理的真相

    《时代周刊》曾评价说:“年过六十的任正非显示出惊人的企业家才能,他在1987年创办了华为公司,这家公司已经重复当年思科、爱立信卓著的全球化的大公司的历程,如今这些电信巨头已经把华为视作‘最危险’的竞争对手。”
  • 推销要有点狼精神

    推销要有点狼精神

    没有什么职业能让你随随便便取得成功,推销也是一样。无疑,这是一项艰苦的工作,它会毫不留情地考验你的耐心和智慧。它看起来门槛很低,但能够坚持超过一年时间的人寥寥无几,究其原因,是浮躁的心态让人们在追求目标的路上无法克服大大小小的障碍,说白了就是缺少一种不服输、勇向前的狼精神。成功的推销员告诉我们:向狼学习,推销将无往不胜。
  • 销售心理学大全集

    销售心理学大全集

    《销售心理学大全集》内容简介:作为销售人士,面子不能随便要,销售都是从被拒绝开始;话不能随便说,聊天就是为了把东西卖掉;卖了东西不等于完活,销售力的提升在于售后人脉的维护……这一切,都需要销售人士解读客户心理,了解人性的特点,精通心理策略。《销售心理学大全集》通过对各个销售行业的经典案例的解析,来为读者呈现销售中的心理学策略,如“如何让客户悦纳自己”“如何解决争端”“如何读懂客户心理”“如何维护长期客户”等。《销售心理学大全集》用浅显易懂的语言将晦涩难懂的心理学应用到销售过程中,让读者更容易学习和掌握其中的方法和策略。
热门推荐
  • 诛情之冷傲男神

    诛情之冷傲男神

    一生情,一世泪,与其有情,为何不无情?世人问我为何无情,我问世人情为何物?情是罪,情是恶,情是悔,情是魔。我欲无情,谁能拦我?
  • 相爱相伤:军官少尉的骄傲妻

    相爱相伤:军官少尉的骄傲妻

    五年前,她因他订婚那天离开,自己等了他十二小时,从白天到夜晚,那晚她整夜没睡,只为等他。第二天他回来了,她欢喜地跑过去,以为还有挽救的机会。可,当看到他那白色衬衫随处可见的红唇,颈处的吻痕她迟疑了。匆匆跑回房间,只为不让他看见自己丑的一面。临走前,她问他昨晚发生什么事?他却只是深深的看了她一眼,转身离去。自己含恨出国,却不想飞机出事,掉入大海。临死前,她想着,如果阮知言和宋之久不相识,不相爱。那么,他们是否会有着不同的生活?
  • 英雄联盟之逆刃

    英雄联盟之逆刃

    他们都说我是穿着东方盔甲的奇怪人,但我只想顶在最前面,用我的长枪保护我的朋友。————德邦总管我醒来了,但是我什么都不记得。我很害怕,我包裹住我的身体,然后在黑暗中哭泣。————殇之木乃伊我蒙上自己的双眼,只想记住最后看你的那一眼。我刺瞎自己的双眼,只为记住那逝去的红颜。————盲僧这是瓦罗兰,一个爱与战争并存的地方,一个我愿意为之守护一生的地方。
  • 腹黑大魔王:花痴魔妃要爬墙

    腹黑大魔王:花痴魔妃要爬墙

    靠,为什么别的人穿越方式都那么帅气,劳资却是被噎死的。刚刚想明白自己是穿越了的夜未央。靠,为什么别人穿过来都有坏人打,我这里只有一群小乖狼。安抚着撒娇的小狼,夜未央悲愤的想。靠!别人穿越过来都有美男一大堆,为什么我只有一个脏兮兮的傲娇小屁孩!老天爷啊,你何苦如此对我,这个美男咋能是我哥哥呢。看着面前绝世倾城自称是自己哥哥的男子,夜未央愤怒了。从此,她过上了白天勾搭帅哥晚上带小孩的“美妙”日子。“妖哥哥,你好帅,我好喜欢你。”“娘子,你想干嘛。”“我想爬墙,可以不。”“我可以先让你下不了床。”
  • 逃往初夏的爱

    逃往初夏的爱

    他们的爱情,开始于初夏……或许是上天注定的遇见,在浪漫的西餐厅里,他们以别开生面的方式相遇了。她是新来打工的小员工,他是谎称为新员工的西餐厅老板,这样的相遇充满了戏剧化的色彩。在日渐的相处中,感情的种子慢慢发芽,不知何时就长成了参天的模样。
  • 象墓

    象墓

    杨卫华著的《象墓》讲述了这样一个故事:自古相传,野生亚洲象临死前,都能预感到自己的末日来临,会主动跑到它们 的墓地迎接死亡。可以想象的是,象墓之中象牙堆积 如山,那会是一笔如何巨大的财富?千百年来,有多 少人冒着生命危险,跋山涉水,深入丛林探秘,却始 终未能找到传说中的象墓。直至H市一位姓于的研究野生物的教授,在西南 南滚河林区对亚洲象进行科研考察时,无意中破译亚 洲象的生理密码,成功发现一处象墓,称为“中野四 号”,从而使长期困扰生物界的大象墓地,终于浮出 水面。于教授把自己的科研成果,和“中野四号”象 墓的地理坐标图绘制成绝密文档……
  • 霸道总裁之懵懂小甜心

    霸道总裁之懵懂小甜心

    她有着不为人知的身世,而她却在校园时暗恋上了一位男神,而那位男神却不知,究竟会发生什么事呢?敬请期待
  • 夜夜夜的微醺

    夜夜夜的微醺

    被男人背叛前,她纯洁的像一朵白马莲花。而后,她成了一束满天星,看着芬芳,实际已经只剩下干枯的躯壳。她无意于红尘,但又屡屡惹来朵朵桃花。他过尽千帆猛然醒悟是否还能找到那个她。在酒色微醺的时间里,他们是否早已露出了真心……
  • 权妃重生,庶女也倾城

    权妃重生,庶女也倾城

    前世夜轻云轻信家人,却是给嫡兄仕途铺路被推入深渊。以为是老天垂怜觅得良人,倾心相待,最后却落得千刀万剐含冤惨死的下场。重活一世,必当眼明心亮,灭仇敌,抱大腿,力争权贵荣华。视仇敌如蝼蚁狠狠碾于脚下,让他们求而不得,生不易死不得!为了复仇,她毅然走出深闺小阁,上沙场入朝堂,锋芒毕露绝世风华。一朝重生为复仇,从此良心是路人。幸而有那白衣铅华之人,始终含笑相陪,不离不弃。她说:“我助你盛世江山,你许我一世荣华!”他说:“成交!”
  • 三段恋:总裁大人快追妻

    三段恋:总裁大人快追妻

    在最美好的年龄爱上你,青梅竹马,两小无猜,互相信任,互相依赖。在最美好的时光守护你,默默地守护在身边,等的是她能够转身看见他,这是他的愿望,终有一天实现了。在你最落魄的时候救了你,一直陪在你的身边,明明知道不应该,却还是忍不住的想陪在你身边。