- 给这本书评了3.0让自己变强大的,不是征服别人,而是善于合作
合作,是所有生命体的头等大事。
因为不合作的个体没有生存优势,早就在演化中被淘汰出局了。
那么,让我们从一个简单的问题开始:
人什么时候应该合作?什么时候应该只为自己着想?
或者给定一个更具体的情境:
一个人应该继续帮助他的一位从来不思回报的朋友吗?
这也是今天介绍的这本书的作者,全球最富盛名的博弈论专家罗伯特・阿克塞尔罗德,在一开篇就提出的问题。
对于上述问题,每个人都会有自己的直觉。也有的人会说:嗯,要分具体情况而定。
但我们追求认知升级的目的,就是要战胜自己的直觉,超越所谓的 “具体情况”,找到那些可放之四海的极致原则。
1. 关于这本书,首先我们应该致敬的是:这项关于 “合作” 的研究至今已经坚持了 40 多年。作者是一位政治学家,最初他邀请了一位进化生物学家,合作启动这个项目。随着时间的推移,不断卷入社会学家、心理学家、经济学家、法学家、计算机科学家等领域的全球顶级学者,跨界加入这项研究,是一本不可多得的 “神书”。
2. 这本书从序言作者开始就厉害了:理查德・道金斯,是的,就是那位道金斯 ——《自私的基因》的作者。道金斯甚至在序言中写下了这样一句话:“这本书值得取代《圣经》。” 因为他认为这本书的普及,比《圣经》更能促进人类社会整体的进步。
3. 作者主要研究了三个非常重要的问题:第一,人为什么要合作;第二,人在什么时候是合作,什么时候又是不合作的;第三,怎么让别人与自己合作。
4. 对于 “合作” 这一行为,作者设定了两个前提:第一,每个人都是自私的;第二,没有外力干预个人决策。也就是说,每个人都完全可以按照自己利益最大化的本能,来进行决策。
5. 这项研究的方法用一句话就能说明白:邀请不同学科的专家编程,来模拟 “重复囚徒困境”。就好像计算机围棋赛一样,利用游戏程序来穷尽在各种关系中人可能采取的策略,从而找出最佳策略。也就是利益最大化、可持续时间最久的策略。
6. 在这些程序中,参与竞赛的策略有很多种,比如,一报还一报、两报还一报、绝不宽恕、轻易宽恕等等。可以看出,这些策略的观念出发点都不相同,有善意的、恶意的、随机的、欺骗的、老谋深算的。但是,在所有的竞赛中,获得最高分的策略是一样的,都是 “一报还一报”。即:在第一步先选择合作,然后在每一步都采取对方上一步的策略。用中国人的话来说,就是孔子说的 “以德报德,以直报怨”。
7. 没想到吧?这个最简单的模式居然是最成功的策略,体现出四个特性。
善良性:只要对方合作,你就合作,从而避免不必要的冲突,避免不合作导致的成本和损失;
报复性:但是,只要对方背叛,你就要做出反击,使得对方要非常小心地对待你们的合作关系;
宽容性:在反击之后,要宽容,使得对方有机会重新与你合作;
清晰性:这一套行为模式要非常简单明确,使得对方能快速理解和适应你的行为模式。
8. 如果说 “一报还一报” 是最成功的合作策略。那么,怎么才能启动一个合作呢?
要满足两个必要条件:一个是持续的关系,而不是基于信任。也就是说要尽可能频繁地交互和互动,如果双方没有持续关系,只是 “一锤子买卖”,那么大家就不会选择合作,这与道德、信任都没有关系。
9. 另一个必要条件是:一定要对对方的行为做出必要的反应。请注意,不是去试图预测对方,而是基于对方的反应做出反应。我们知道,一个总是背叛的人是不会有人跟他合作的。但是,在这项研究中,人们发现,一个永远合作的人也不会有人跟他合作,因为人们发现背叛你是没有风险的,当然就会选择欺负你,你很快就在 “进化” 中失败了。这就是 “滥好人” 的困境。
10. 如果我们身处(事实上大部分时候都是)“重复囚徒困境” 中时,怎么才能做到对自己的利益最大化呢?通过这个研究,可以总结四个原则:
①不要嫉妒,也就是看好自己的合理利益,不要试图占对方便宜;
②不要先背叛,也就是要做合作的建设者;
③不要姑息,以直报怨,也就是果断反击对方试图伤害合作关系的行为;
④不要耍小聪明,也就是不要把问题复杂化,越复杂的规则越容易失败。
11. 怎么做能够让别人的合作性更高呢?最有效的方法是构建双方都可见的美好未来,让未来比现在更重要,增加未来对人们行为的影响。这并不是空泛虚幻的理念,而是可操作的办法:一方面把合作的周期拉长,从一开始就把关系的持续性建立起来;同时,还要把这个大周期分解成若干可以高频互动的环节。
好比是两性关系,要想提高合作性,一是要建立婚姻关系这种长期契约,同时还要每天在一起共同生活。又好比是甲乙双方合作,可以签一个尽可能长期的大合同,但是付款和验收要划分成很多次。
12. 这本书还提供了一个很反常识的认知:一般而言,我们都以为企业或者个人,是靠信誉建立别人对自己的合作信任。很残酷,其实不是。别人与我们合作,更多的是因为我们的威慑力。
在一报还一报策略中,实力决定关系。你越有反击的威慑力,人们就越会选择合作而不是背叛。其实,就是 —— 用实力说话。
最后,让我们永远记住这项研究留下的这个金句:
能真正让自己变强大的,不是征服别人,而是全力创造合作。25转发同时评论快速转发566分享「微信」扫码分享给这本书评了4.0你要选择善良,更要保留锋芒这本书是博弈论领域非常经典的书籍,它深入探讨了一个事关人类社会存在的根本问题:假设人人都自私自利,合作是如何产生的?产生之后又是如何维系的?《合作的进化》这本书作为博弈论领域特别重要的一本书,给了我们一个非常重要的启发:做一个有原则的好人,是极具竞争优势的。本书作者罗伯特・阿克塞尔罗德,著名的行为分析与博弈论专家,美国科学院院士。他擅长于运用计算机模型来分析社会科学问题,是这个领域的权威学者。为了研究自私与合作在人类社会中的关系和博弈情况,阿克塞尔罗德根据博弈论的原理设计了一系列计算机算法比赛,也就是用计算机模拟囚徒困境,而且是多次重复博弈,并邀请了一堆牛人提出了 15 个博弈策略,并编程用计算机进行模拟。这 15 个策略在计算机上进行一对一的循环赛,整个循环赛重复了 5 次,一共是 12 万个回合,最终结果令人惊讶:得分排名前 8 位的是清一色的好人策略,而 6 个坏人策略和 1 个随机策略排在最后 7 位。也就是说,好人大获全胜,坏人全线溃败。为了保证实验的可信度,阿克塞尔罗德随后又组织了第二轮比赛。这次的参赛人数扩大到了 63 个策略模型,进行了上百万回合的模拟,结果好人策略又一次获得了压倒性优势:得分排名前 15 位中只有一个坏人策略,排在第 8;而得分排名最后 15 位中只有一个好人策略。这个结果证明了,无论是在生存还是在生活环境中,合作策略才是最优生存策略,人们仅仅为了个人利益也会自发地展开合作。在这两轮比赛中夺冠的,居然是同一个好人策略,叫做 “一报还一报”。这个策略的行动原则非常简单,也就是:第一步选择合作,从第二步开始,重复对手上一步的动作,对手合作,我也合作;对手背叛,我也背叛。这一策略看上去简单粗暴,但是却暗藏智慧。首先,它是善良的,它一开始就选择合作,而且绝不会先背叛对方。其次,它是不好欺负的,如果对手背叛,它会马上用背叛来反击,这就让对手不敢轻举妄动。再次,它是宽容的,如果对手恢复合作,那么它也恢复合作,既往不咎。最后,它的行为模式是清晰的,简单明了,别人一看就懂,知道从它身上占不到便宜,只能选择合作。阿克塞尔罗德认为,这四大优点,也就是善良、不被欺负、宽容和清晰,正是 “一报还一报” 策略能够连续夺冠的根本原因。换句话来说,就是要做一个有原则、有底线的好人。此外,光有这四个优点还不够,还得有行动准则。阿克塞尔罗德给了四点具体建议:第一,不要嫉妒;第二,不要首先背叛;第三,赏罚分明;第四,不要耍小聪明。就是这些简单明了的原则,在长期的博弈中,让好人取得胜利。当然,这个模拟本质上是对现实情况的抽象和简化,它能反映出真实世界的一些规律,帮我们发现一些底层逻辑,但它毕竟只是模拟,无法彻底还原,因此同样具有局限性。社会的真实演化进程并不是单向的,而是在这两种情况之间来回波动。合作与背叛的选择,是个动态博弈的过程,无论是好人策略还是坏人策略都不可能获得一劳永逸的胜利,这是我们应该要看到的。毕竟所有模型都是错误的,但其中一些是有用的。世界复杂而又残酷,这种实验的意义就是让我们更透彻的了解了合作与背叛之间的关系,提出了一种选择的可能性,这非常重要。因为它告诉了我们,你可以选择善良,但必须要有锋芒。
1转发同时评论快速转发123分享「微信」扫码分享给这本书评了5.0最优的策略是“针锋相对”在国际政治领域,被引用最多的一本书是一个数学家写的,即罗伯特・阿克塞尔罗德的《合作的进化》。
阿克塞尔罗德用计算机程序模拟人们的策略选择,通过多次博弈,试图找出什么才是最优的策略。经过反复的计算机模拟,最后胜出的策略是 “针锋相对”。
这个策略很简单:(1)对别人要好,准备跟别人合作;(2)要是别人背叛了你,就要做出回应,果断地不跟他合作;(3)要是别人悔过了,就既往不咎,继续跟他们合作。阿克塞尔罗德还讲了很多有趣的故事,探讨在看起来不可能出现合作的地方是如何实现合作的,比如战场上交战的双方士兵之间都可能会出现默契。8转发同时评论快速转发115分享「微信」扫码分享给这本书评了4.0一报还一报真的就是最佳的吗?相信不少人没看过,也听过这本书,尤其是对于一报还一报的策略耳熟能详,甚至以为这就是最好的合作策略。抱着这样朴素美好的愿望是可以的,不过要是在现实中遭受了委屈可别太怪作者。
只要你翻过原书,哪怕只是看过译者的话,也应该明白这个计算机模拟出来的博弈策略是指面对囚徒困境时,一报还一报的策略常常并不会比对手更好,所以它并不是制胜之道。那为什么还遭到推崇呢?因为它可以促使双方从两败俱伤的局面中走出来,从而达成双赢合作。相信对此了解后,你在实践中就不会太过于盲目和感情用事。
一报还一报,想当然会被理解为你和我合作,我就合作;你背叛,我就惩罚。这样理解倒也不能算错,但是现实中可能会出现对方无心之过导致释放出错误的信号,这个时候你该如何去做?不少人可能会继续执行,但有些人会考虑到容错空间,会调整为对方背叛两次才会进行惩罚。这里就见仁见智,具体选择就看个人的偏好。
惩罚过后,对方再选择合作,你会如何做呢?有些人可能会对于背叛的人,选择原谅,但是不会再进行合作。这样出于自我保护的感情而言,倒也无可厚非,但是借鉴本书的思考,你还是应该选择合作。不过考虑到计算机程序的模型和现实情况,我个人的看法是你可以再度选择合作,但是要吸取前车之鉴,一定要让对方意识到合作是最好的,否则就要承担沉重的代价。
相信听过每天听本书的解读版,一定会对赵汀阳教授提出的杀不死理论感兴趣,这就是本书中的一个 bug,因为在现实中坏人选择背叛后可能会选择干掉对方,这样一报还一报的游戏就没法再玩了,可能最后就逐渐演变成坏人扎堆,而你为了自保,甚至不得不同流合污。对此我的个人看法是,幸好我们不是计算机程序,有自主能动性,如果考虑到对方会这样做,不妨尽早进行安排,从而让对方的理性选择是合作,而非背叛。转发转发同时评论快速转发评论8分享「微信」扫码分享给这本书评了5.0《合作的进化》本书是研究合作问题领域的最重要著作之一。作者根据博弈论原理设计了一系列计算机仿真游戏,以此来探究,在人人都自私自利的情况下,合作是如何产生的?产生之后又是如何维系的?著名进化生物学家、《自私的基因》作者理查德・道金斯认为,对于人类社会的进步而言,这本书比《圣经》更重要。本书核心内容:1. 这个游戏到底是怎么玩儿的;2. 这个游戏给了我们什么重要启示;3. 这个游戏在多大程度上反映了真实世界?第一,这个游戏其实就是在计算机上模拟囚徒困境,而且是多次重复博弈。在两轮比赛中好人策略都大获全胜,而冠军是一个非常简单的 “一报还一报” 策略,它拥有善良、不被欺负、宽容和清晰这四大优点。第二,这个游戏给我们的启示是,如果我们想要在现实博弈中获胜,就要向冠军策略 “一报还一报” 学习,记住四条重要建议:不要嫉妒、不要作恶、赏罚分明、不耍小聪明。同时,要增加未来的影响力,确保未来足够重要,合作才能稳定持续。第三,这个游戏模拟现实世界比较成功的地方在于,它不需要预设道德前提,不要中央权威的干预,参与的策略多种多样,博弈的回合数足够多等等。但是它也存在一些漏洞,比如 “杀不死” 假设,以及认为合作是单向演化的。合作问题可以说是人类社会的头等大事,如何才能让人类社会实现合作最大化、冲突最小化,让人类走出 “囚徒困境” 的牢笼,一直是古今中外的思想家们苦苦探索的问题。阿克塞尔罗德游戏的结论在某种程度上和儒家思想是相通的,都相信 “仁者无敌”。游戏结果表明,在一定条件下,做好人能够获得显著的生存优势,这就给了我们希望,人类社会建立起永久合作是有可能的。但另一方面,我们也不能过于乐观,游戏与现实还是存在一定差距。光靠个人的利益博弈,还不足以让破坏合作的坏人坏事彻底消失,制度建设、道德建设也仍然是不可或缺的。
转发转发同时评论快速转发14分享「微信」扫码分享给这本书评了5.0合作将如何进化?#管中窥豹读书计划第 827 本(100)#《合作的进化》🚢一个乐观主义者首先必须承认基本的现实,它既包括人性的现实,也包括所有生命本性的现实。这里所说的生命是达尔文意义上的生命,它涵盖宇宙里的所有生命。在适者生存的达尔文世界里,充满着那些使得生存者生存下来的特质。🚢在与他人的持续交往中,人什么时候应该合作,什么时候只需为自己着想?一个人会继续帮助他的一位从来不思回报的朋友吗?一个公司会给另外一个濒于破产的公司及时的支持吗?一个国家应如何面对另一个国家的敌意行为,应遵循怎样的行为模式才能赢得其他国家的合作?🚢产生了进一步的想法:考虑没有集权的利己主义者之间合作如何出现。这个考虑带来三个明显的问题:第一,潜在的合作策略如何才能在不合作占优势的环境中取得最初的立足之地?第二,何种策略能在由其他各种简单和复杂的策略组成的多样化环境中脱颖而出?第三,在何种条件下,这样的策略一旦在群体中完全立足,就能抵御不合作策略的侵入?🚢合作理论是基于对追求自身利益的个体的研究,而且这些个体中并没有什么中心权威强迫他们相互合作。个体追求自身利益,彼此之间的合作便不是完全基于对他人的关心或对群体利益的考虑。假设个体追求自身利益就是为了研究这一难题。但必须强调的是这种假设的局限性实际上很小。🚢一般说来,一个策略(或决策规则)说明在任何可能出现的局势下如何去做。这个局势本身取决于游戏的历史。因此,一个策略在某个相互作用的格局下可能合作,在另一个格局下则可能背叛。另外,一个策略可以使用概率。例如,一个规则在每一步都完全随机地以相同的概率选择合作和背叛。一个策略还可以巧妙地使用至今为止的对策结果来确定下一步该如何做。🚢事实上,在 “囚徒困境” 中表现最好的策略直接取决于对方采用的策略,特别是取决于这个策略为发展双方合作留出多大的余地。这个原则的基础是下一步相对于当前一步的权重足够大,即未来是重要的。换句话说,折扣系数 w 必须大到使未来在全部收益计算中显得很大。总的来说,如果你认为今后将难以与对方相遇,如果你不太关心自己未来的利益,那么,你现在最好是背叛,而不用担心未来的后果。🚢对竞赛数据的分析揭示了一个成功的决策规则所应有的四个特性:只要对方合作你就合作以避免不必要的冲突;面对他人的无理背叛你是可激怒的;在给挑衅以反击之后你是宽容的;行为要简单清晰,使对方能适应你的行为模式。🚢生物系统中的合作即使在参与者不相互联系,或它们没有能力评价自己行为后果的情况下也有产生的可能。使这种可能出现的前提是基因的进化机制和适者生存。一个能够从其他个体得到有利的反应的个体会有更多的后代,而且这些后代将继续这个能从其他个体引出有利反应的行为模式。因此,在适当的条件下,基于回报的合作在生物世界是稳定的。🚢当一个给定的个体与许多使用各种不同策略的其他个体相互作用时所发生的情况。结果说明了 “一报还一报” 的明显成功。而且,模拟未来竞赛的生态分析表明,“一报还一报” 将继续繁荣,最终被大家所采用。假设每个人最终都采用同样的策略,然后将会发生什么呢?人们有没有什么理由采用不同的策略呢?或者说,大家会保持选择这个公共的策略吗?
转发转发同时评论快速转发评论3分享「微信」扫码分享给这本书评了5.0走出对黑暗森林法则的盲信西方有一句从古罗马时期流传下来的拉丁谚语 “人对人是狼”(Homo homini lupus),极其简练地描述了无政府状态下人人自保而又互害的景象。
这句话在后世有着广泛的影响,无论是中世纪的神学家伊拉斯谟、政治学家霍布斯,还是近代的精神分析学派创始人弗洛伊德,都曾在自己的著作中引用过它。
比如弗洛伊德就曾在《文明及其不满》一书里说到:“人类并不是温和的动物… 相反,在人这种生物的本能里,我们能发现强大的攻击性成分。对他们而言,邻居… 就是满足自己进攻欲望的对象… 人们总想未经同意就夺取邻居的财产、羞辱他、给他造成痛苦,折磨并杀害他。人对人是狼。面对生活和历史的所有先例,谁还有勇气对这种论断表示异议呢?”
在弗洛伊德这本书问世的十年前,第一次世界大战刚刚结束,19 世纪时曾经身居人类文明顶峰的欧陆诸国在大战中厮杀数年,上百万年轻人毫无意义地死去,无数财富化为灰烬。亲身经历这场浩劫的人很难不发出 “人对人是狼” 这样的感慨。
不过如果把视线放得更远,那么我们也可以发现,整体来说,现实世界尽管有其残酷的一面,但也并没有谚语描述得那么极端和黑暗。
我们如此自信的原因,一方面除了现实中处处可以观察到的合作现象和已经良好运行多年的信用体系,另一方面更得益于罗伯特・阿克塞尔罗德等人在博弈论领域所开展的理论研究。后者直接通过一系列复杂的计算模拟证明,不需要友谊、信任,合作依然可以在自私的个体之间自发出现。
《合作的进化》这本书正是阿克塞尔罗德研究的精华。
在这本书中,作者详细介绍了他举办的那场有着深远影响的 “重复囚徒困境博弈策略的计算机锦标赛”。来自全世界不同国家、不同学科的科学家们提交了数十种不同的博弈策略,这些策略中有的坦诚、有的狡诈,它们彼此在计算机中捉对厮杀,经历几百轮比赛后,胜出的却总是那些更充满合作精神的策略。
在此之后,作者进一步列举了自然界和人类社会中的各种自发合作的例子,表明合作自发产生并不只是停留在理论上的空想,而是有着无数现实情况进行支撑的事实。
作者介绍的这些事实中,最具有戏剧性的就是第一次世界大战中西线敌对双方士兵之间自发达成的停火协议:在长期的堑壕对峙中,双方士兵们绕开了机枪和铁丝网的封锁,奇迹般地通过规律的炮火、无害的射击,形成了心照不宣的 “让自己活、也让别人活” 的合作系统。
在大战后的几十年里,大量双方基层士兵军官的书信档案被人们发掘出来加以研究,这套自发形成的合作系统终于渐渐进入人们的视野,为第一次世界大战的残酷底色染上了一层不一样的色彩。
《合作的进化》是一本充满乐观主义基调的书,尽管如此,它的结论却不应该被认为是幼稚的。
我们在阅读这本书的时候,可以处处感受到作者严谨的分析和审慎的推演。阿克塞尔罗德并没有盲目推广他得出的结论;恰恰相反,作者为自发合作如何产生确定了清晰的条件,它们具体是什么,还需要读者自己在书中寻找答案。
近年来,流行文化渐渐开始推崇所谓的 “黑暗森林法则”,这个法则被很多人不加思辨地滥用,在他们看来,这个世界似乎处于一种处处互害的现状下,信任他人就是不谙世事的 “傻白甜”。如果你也对此表示赞同,那么不妨读一读《合作的进化》,说不定你会对这个世界的底层运行逻辑有全新的认识。转发转发同时评论快速转发评论1分享「微信」扫码分享给这本书评了5.0达观这是一本乐观的书,但这种乐观是可信的,它不是天上掉馅饼式的、不切实际的天真愿望(或者革命的狂热)。为了可信,一个乐观主义者首先必须承认基本的现实,它既包括人性的现实,也包括所有生命本性的现实。这里所说的生命是达尔文意义上的生命,它涵盖宇宙里的所有生命。在适者生存的达尔文世界里,充满着那些使得生存者生存下来的特质。按照达尔文的说法,我们悲观地假设生命在自然选择这一层面是极端自私的,对苦难无情地冷漠,残忍地损人利己。然而从这个被扭曲的起点开始,即使不必是刻意的,类似于友善的兄弟姐妹般的伙伴关系也会出现。这就是罗伯特・阿克塞尔罗德这本不平凡的书要传递的令人振奋的信息。
转发转发同时评论快速转发评论赞分享「微信」扫码分享给这本书评了5.0一本书论述自私的人之间如何产生合作的书【8 级,118k】首先,这本书的名字我不是很喜欢。《合作的进化》听上去像是一群个体先产生了合作,然后在合作中协同进化。而它真实的意思是:合作是如何一点点进化出来的,或者说进化中如何产生合作的。但这本书的书名并不影响它在我心中的地位。我曾看过关于它的演讲、听过关于它的课,有人称它对《自私的基因》最好的补充,也有人说它完善了《进化论》,更有人说它是民主社会的《圣经》。我认为他们说的都没错,因为它解答了一个最重要的问题:没有 “家长” 的情况下,人人自私的社会是如何产生 “合作” 的。我读过《失控》,了解了个体特征和集体特征中间存在巨大的鸿沟,就好像说一堆拥有简单功能的神经细胞与大脑复杂思考之间存在巨大的鸿沟,这个鸿沟叫做 “涌现”。我们小时候的教育告诉我们,现代的合作依靠的是教育、利他精神和强权政治。而现代社会,尤其是欧美社会中的绝大多数人可以放心大胆地自私,他们不需要刻意的集权系统,也不需要集体主义,却不影响他们合作产生出 “硅谷”、“登月计划”、“原子弹”、“华尔街” 这种体量超过集权体制能力产物。这个从自私的个体到合作的集体的 “涌现” 是如何产生的?这种合作牢固么?它会被破坏么?这一直是我心中巨大的疑问,也一直是民主社会所担心的。而这本书很好地解答了我的疑问。简单来说,现代社会存在两个常见的博弈论问题:零和博弈和囚徒困境,而零和博弈只存在于静态封闭系统(比如下棋、封闭的国际空间站、孤岛),在资本主义和科技爆炸的真实社会下其实是不常见的。更常见的其实是囚徒困境,甚至是重复囚徒困境。囚徒困境的难点在于,自私的人做自私的选择(背叛),其实是能让自身利益最大化的,但是想要集体利益最大化,需要做利他的选择(合作)。如果是单次囚徒困境问题,合作是无法产生的,但是重复囚徒困境中的 “重复”,改变了一切。在重复囚徒困境下,不同的策略的个体会产生不同的集体行为,而在多次博弈中胜出的策略是 “一报还一报”(善良),而众多善意的 “一报还一报” 的涌现出来的就是合作社会。“一报还一报” 可以在 “非善良” 的竞争中存活下来,然后在相互背叛和协作中胜出成为主流,甚至可以抵御 “总是背叛” 和 “随机性背叛” 等策略的入侵,拥有很好的鲁棒性。它的优点在于:善良(不首先背叛)、规则明确、回报和报复及时,而它的缺点在于:会陷入重复报复的死循环。但因为重复囚徒困境的合作收益是大于背叛的,“一报还一报” 的优点可以确保它在多样性的环境下不被恶意策略占便宜,而与善意策略合作产生更大的收益。它虽然从没有在任何一个 1-1 博弈中胜出,但是它的总体收益是最高的。值得注意的是:重复囚徒困境下,“一报还一报” 不是唯一占据优势的策略,几乎所有的善意策略(倾向于合作、及时报复、规则清晰)都排在恶意策略之前。而想产生这样的重复囚徒困境需要有三个必要条件:1. 重复次数要够多,而且游戏终点不能是明确的,2. 合作收益要超过背叛收益,3. 参与游戏的个体可以识别出对方并记住相互对战史。现代社会中,信用、法治、舆论监督和社会评价体系(比如 yelp)就会促进 1 和 3,动态的 + 生产力提高的社会可以保证 2,所以社会整体是善意的(倾向于合作的)。而这种环境下协作早晚会出现,“友谊”、“利他主义思想”、“亲缘关系” 只是提前启动了进化中合作的部分,并不是必要条件。而这本书更是扩展了讨论的范围。比如一战中战壕战双方就显示出了互不攻击的善意:因为双方士兵长期对峙并且无法预计到战争结束的时间(满足 1 和 3),互相攻击没有明显收益却有明显损失(满足 2),所以他们不愿意在没有强制命令下发动攻击(合作)。比如自然环境中鸟和鳄鱼间的共生关系:鳄鱼允许鸟清理牙齿,鸟也可以轻松获得食物(满足 2),共生关系发生在特定的鸟和特定的鳄鱼之间(满足 3),而且他们长期接触(满足 1),所以共生关系成立。再比如大肠杆菌和人体:人体需要大肠杆菌帮助消化、提高免疫力,而大肠杆菌可以轻松获得食物(满足 2),大肠杆菌紧贴人体寄生可以帮助它识别人体,而人体的免疫系统可以识别大肠杆菌(满足 3),大肠杆菌无处不在,人类难免会接触到它(满足 1),所以产生了共生。这本书甚至讨论了冷战中的博弈和地缘政治(领地系统)等不同条件下的博弈策略,论证了:在复杂的重复囚徒困境下,虽然 “一报还一报” 并不总是最优策略,但善意策略总体来说还是会胜出,除非重复囚徒困境不成立(比如冷战中苏联被颠覆,所以游戏存在较短的终点,从而从重复囚徒困境退化为囚徒困境)。总之,这本书证明了:自私的人也可以在重复囚徒困境下产生广泛的合作,社会整体的善意是自然而然的、稳定的、不容易被入侵的。这个理论给民主政府构建了一个稳固的地基:要尽可能维护这个重复囚徒困境。我会把这本书强烈推荐给所有不怵专业性书籍的人。
转发转发同时评论快速转发评论赞分享「微信」扫码分享给这本书评了5.0合作是良药书籍信息:《合作的进化》,罗伯特・阿克塞尔罗德(Robert Axelrod)。阅读数据:Weread-No.53,2023-No.12,20230531-20230602 读完。耗时 9h,12w 字,1.3w/h,适合精读。整体评分:10 分(满分 10 分)。微读推荐值 92%。今年读到的第二本可以给 10 分的书。科学性很强,论证逻辑严密、论据很强,读起来让你不得不信。是一本靠谱的书。关键词:博弈论、囚徒困境、合作、策略。行为改变:特定环境考量下的策略选择、单次博弈可拆解成重复博弈创造合作环境。主要收获:1、合作的产生:没有友谊也可以合作吗?合作的本质是利益交换。所谓的利益,不仅指 money,还包括权力、资源、资本等等(具备资产性质的生产要素)。核心是你的欲望(需求)和对方的欲望(需求)之间的平衡态。友谊,能够促进合作,但并不是合作产生的必要条件。没有友谊的双方,也是可以产生合作的。所谓 “没有永远的朋友,只有永远的利益”,说的就是这个道理。扯这么多,跟这本书的观点有啥关系?其实这是书中的一个衍生观点。Axelrod 在《合作的进化》中,通过经典的囚徒困境这个问题,试图寻找这个场景下的有效答案,通过多种对抗实验,证明了(真的是证明,看看最后的 8 个命题和这本书的附录)从长期来看,当囚徒困境在长期博弈的情况下,合作才是更优解,而博弈双方的合作是基于利益,而非友谊。这个观点,在我们的日常生活、工作、商业、社会等场景中,适用面还是非常广泛的。比如在工作场景中,跨部门协作这个点上,大概率会是一个重复博弈的场景,如何有效合作推进项目而不累,这就是一个很好的参考点。比如在商业中,经常看到某些行业的老对头,平时你干我、我干你,但在某些情况下又产生了 “亲密合作”,结果还不赖,这种例子比比皆是。当然,反面教材也很多,比如在本书中作者提到的 “总是背叛” 策略,这种案例容易出现在比较狭隘的竞争环境中,当然某些情况下也不失为一种可选择的策略,但大概率不是最优。2、合作的原则:善良、报复、宽容、清晰。>> 善良,指的是不要首先背叛。书中的命题 2 如下:“一报还一报” 是集体稳定的,当且仅当 w 至少比(T-R)/(T-P)和(T-R)/(R-S)中较大者更大。这里解释一下上面的命题:w 指的是再次合作的概率;T 即 tempt,指的是对背叛的诱惑;R 即 Rewards,指的是对合作的奖励;P 即 Punishment,指的是对背叛的惩罚;S 即 Stupid(或者 Silly,不太清楚具体是哪个,我猜的),指的是对方背叛而你选择合作的愚蠢奖励。以上 T/R/P/S 是在囚徒困境下出现的 4 种 case,对博弈双方对应的选择进行赋值,当然这个赋值是有讲究的,即(T+P)/2>R。那么在这种情况下,Axelrod 设计了 2 轮游戏,要求各领域专家提交博弈规则,多个规则进行对抗,看看谁提交的规则得分最高。出人意料的是,规则最简单的 “一报还一报” 获得了 2 轮全胜,都是最高分。“一报还一报” 这个规则很简单:首先,第一次选择合作;其次,后续的每次选择均基于对方上一次选择。嗯,就是这么简单。就是这个规则,在两轮比赛中,系统性地获得了最高分。其首要原则就是:不首先背叛,第一次就选择合作。当然,这个实验是在重复博弈的情况下进行的,因此其成为了最大的赢家(best score),它在单次博弈中并没有多大的胜算,甚至得分比对方要低;但是在重复博弈的情况下,反而拿到最高分。这给我们的启发是什么呢?如果你遇到重复博弈的情况,建议你善良,不要选择背叛。其实这个也很好理解,你的善良,并不代表软弱,而是释放诚意;如果对方能够 understand 你的意图的话,大概率是能够促成长期合作的(你打算与其合作的,大概率不是傻子)。>> 报复,指的是对于对方的背叛,要予以反击。没有谁愿意当一个老好人,任人欺负,除非脑子瓦特了。对方的背叛,要么是一种尝试,期望在你们的合作中占据制高点;要么是对方确实没有诚意。无论是上述哪种情况,予以反击大概率是更优解。如果是第一种 case,那么你也要表明你的立场,把公平合作的态度摆出来;如果是第二种 case,那么,就这样吧,还合作啥?因此,对于对方的背叛,即时予以反击,这是原则性的问题。这时有的人会说,如果对方是你的朋友或熟人怎么办?这种情况更应该予以强力反击!朋友和熟人不是拿来欺负的,而是合作的润滑剂和更优路径。>> 宽容,指的是在你对对方的背叛予以反击之后,也要学会宽容对方。从理性的角度来看,“没有永远的朋友,只有永远的利益” 这句话确实是理性的。对于对方的首次背叛,你可以选择 “一报还一报”,当然也会有人选择 “两报还一报”,也可以遵循 “事不过三” 的原则。上述情况是针对对方的首次背叛的可选应对策略。那么,如果你已经予以反击了呢?建议的策略是采取宽容态度,不要一直选择背叛性策略,那样只会造成恶性循环。在你反击对方的背叛并予以宽容之后,看对方的反应:如果对方最终选择了合作策略,那么你可以继续合作;如果对方也选择了背叛策略,这种情况建议终止合作。这里有人可能会问到:如果我确实非常需要跟对方合作呢?这里建议是将单次博弈拆解成重复博弈,或者改变其他有利于合作的环境变量等方式,促成合作。>> 清晰,指的是你的行为对于对方而言是清晰明简洁的,能让对方看得懂。如果你的行为变化莫测、或者太过复杂,别人根本看不懂你,那么对方采取合作策略的可能性大概率会降低。如果对方对于你的行为没有一个稳定的预期,没法确定其合作策略是否能够带给其对应的收益,那么它采取的策略要么是背叛、要么是不合作(即不背叛也不合作)。优秀的合作者,总是能够让自己的行为在对方看来简单清晰,让对方对你有较为稳定的预期,创造有利于长期合作的可能性。总结一下,良好的合作原则应包含这样四个要素:善良、报复、宽容、清晰。3、“一报还一报” 的核心,并不是赢得每次胜利,而是引导对方合作,这才是其核心意义。“一报还一报” 的核心目的,并不是取得每次博弈的胜利,而是引导对方进行合作。其第一个原则 “宽容” 就注定了没法做到赢得每一次胜利。但是,无论从 Axelrod 的两次著名博弈实验来看,还是从贝叶斯主义来看,重复博弈情况下,如果你的博弈对手在智商、情商上与你拉齐的情况下,大概率还是能够产生合作的。保持善良、报复、宽容、清晰的原则,更容易产生长期意义的合作。另外,“一报还一报” 的博弈策略还具备鲁棒性。在多种实验场景及思维实验中,这个策略仍然能够在大多数情况下取得最高分或次高分。良好的鲁棒性给我们的启发是,如果 “重复囚徒困境” 的场景存在,而且你期望通过合作获得长期收益或者取得全局最优的话,那么,不用怀疑,采取 “一报还一报” 策略大概率不会出问题。4、关于书中的几个命题。命题 1:如果折扣参数 w 足够大,不存在独立于其他人所采用的策略的最好策略。命题 2:“一报还一报” 是集体稳定的,当且仅当 w 至少比(T-R)/(T-P)和(T-R)/(R-S)中较大者更大。第二个命题说:如果每一个人都采用 “一报还一报”,且未来是足够重要的,那么,没有人能通过改变到其他策略而做得更好。特性化定理:B 是集体稳定策略,当且仅当,在对方累积得分足够大的第 n 步时 B 采取背叛,即当 Vn(A|B)>V(B|B)-wn-1 [T+wP/(1-w)]。命题 3:任何可能首先合作的策略 B,只有在 w 足够大时,才能是集体稳定的。命题 4:一个善良策略要成为集体稳定的,它必须能被对方的第一个背叛所激怒。命题 5:“总是背叛” 的策略总是集体稳定的。命题 6:能以具有最小的 p 值的小群体侵入 “总是背叛” 的策略是那些具有最大区别力的策略,如 “一报还一报”。命题 7:如果一个善良的策略不能被一个单一的个体侵入,它也就不能被这种个体的任何小群体侵入。命题 8:如果一个规则是集体稳定的,它也是领地稳定的。
转发转发同时评论快速转发评论赞分享「微信」扫码分享给这本书评了3.0合作理论的主要结论是令人鼓舞的,它们说明即使是在一个其他人不愿合作的世界里,合作仍然可以通过一小群准备回报合作的个体来产生。分析还表明合作能发展的两个关键前提是合作要基于回报和未来的影响要足够重要以使得回报稳定。但是,基于回报的合作一旦在群体中建立,它就能保护自己不受非合作策略的侵入。合作的社会结构 1、标记 — 易被识别的部分,长相等;2、信誉 3、管理 — 统治者与被统治者的关系 4、领地 — 只与圈子内的人合作而排拆圈子外的人 “一报还一报” 是应对 “囚徒困境” 最成功的方式,是因为 1、善良性 — 决不首先背叛,以防止陷入不必要的麻烦;2、可激怒性 — 使对方一旦尝试背叛就不敢坚持;3、宽容性 — 有助于恢复双方合作;4、清晰性 — 使行为方式容易被识别,因而逼迫对方同你进行合作。但这一方式也有其缺点,但你的背叛不能给别人带去足够刻骨铭心的痛苦的时候,背叛可能会无限循环。
转发转发同时评论快速转发评论赞分享「微信」扫码分享 - 加载中...