本篇文章3894字,读完约10分钟
文/本财经意见领袖专栏(微信公共平台kopleader )机构专栏纽约金融论坛作者王韬(纽约金融论坛员工,目前就读于康奈尔大学,研究方向是宏观经济和国际金融)。
例如,如果一个女孩选择了对象,无法确认追求者是否真的爱上了她,她就需要用来自追求者的信号来评价。 发出信号需要价格,要说明真爱,需要发出足够价格的信号来强调你和别人不同。 在这样的游戏中,均衡是什么样的呢?
各位,今天谈谈博弈论吧。 说到博弈论,最多人的第一反应是约翰·纳什,因为他不仅是诺奖,而且是那部经典电影《美丽的心》。 所以不知不觉中,纳什成了博弈论的代名词。
但是纳什不是开拓博弈论的先驱,以前很多经济学家都开始研究。 纳什的贡献只是数学上说明了混合战略均衡的存在。 这个以后再说。
说到博弈论,另一个最多的反应是“囚犯困境”,这是大部分人都知道的,这是最简单的游戏模型。 两个个体的合作利益最大,背叛方的利益更大,彼此的背叛利益最小,在囚犯的困境中纳什均衡是指两个个体互相背叛。
这样的结果二次优良,但很均衡。 生活中有很多符合这个特征的场面。 囚犯的困境也被视为人类合作的失败之一。
除了囚犯的困境,还有搭便车和公共悲剧等古典合作的困境。 这些在这里按表格。
那么游戏除了这个最简单的场景以外还包括什么复杂的场景? 这就是我今天讨论的问题。 我的说明希望对博弈论不太了解的朋友掌握博弈论的整体思考框架。
什么场面构成游戏? 首先是交互过程。 至少两者都参与了。 其次,最重要的是一种行为会影响另一种行为的收益。 你怎么办,对我怎么办有影响。 面对你的行动选择时,我可能有不同的应对措施。
没有人情的经济学家把人际关系的许多例子看作游戏。 例如恋爱,实际上理性计算的交易不是爱,但如果提取人类理性依赖量进行交易的部分,则成为model。 有本书叫《简·奥斯汀:博弈论学家》。 大家都可以感兴趣地去看。
一个游戏从简单到多在两个纬度进行。 一个纬度从静态到动态,简单来说,就是一次不重复买卖,你成了我来往的多次交往。
另一个纬度是完全从新闻变成新闻。 两个纬度、四个象限是博弈论模型多而复杂,接近现实世界相互作用的过程。
大家看下图一目了然。
1 .静态完全新闻游戏
首先,我们来看完全新闻的游戏。
最简单的是完全新闻上的游戏。 什么意思? 我们俩都行动了,行动结束了,游戏结束了。 前面提到的简单囚犯困境是游戏。 在这样的方案中,会产生纳什均衡。
最简单的情况是只有一个平衡。 说白了,我知道你最好的策略是什么,你也知道我最好的策略是什么,你知道我是你最好的策略。 反之亦然。
在囚犯困境的例子中,我知道对方一定会背叛我。 那对他来说是最好的,所以我也只能背叛。 没有共谋,没有事先商量空之间,分别选择。
可能有多个均衡。 比如,我们喜欢吃豆浆和油条。 我喜欢做牛奶和面包,但我喜欢豆浆油条。 我喜欢牛奶面包。 你去买油条和面包。 我去买牛奶和豆浆。 每人都买各自的。 没有信息表现。 我只买同样的东西。
这种情况下,无论最终买来的是豆浆油条还是牛奶面包,都很平衡。 因为你和我,单方面都做得比现在好。 这就是均衡的意思。
但是,在某些情况下,我们绝对没有出色的战略。
最近世界杯上举个射PK的例子吧。 投篮的人是左边还是右边? 哪个好? 我希望投篮的方向和门击球的方向相反。 门口要求的是一样的。
博弈论家说,这没有纯粹的战略均衡,只有混合战略均衡。 也就是说,我们最终以一定的概率踢左边,以一定的概率踢中间,以一定的概率踢右边,门也以一定的概率踢左边,以一定的概率不动,以一定的概率打右边。 在这样的概率分布中,存在均衡。
说明每个游戏都有这样的混合战略均衡是纳什的贡献。
2 .动态完全新闻游戏
我说了纳什均衡。 让游戏更复杂吧。 沿着时间纬度前进一步,一次游戏就会有多次互动。
这个展开有两种情况。 一个是重复游戏。 也就是说游戏反复进行。 很多人知道重复游戏会处理囚犯的困境,两个人有可能开始合作。
有使这种合作成为可能的战略,被称为“一键”战略。 也就是说,如果你合作的话我会和你合作。 如果你背叛了我,我也不能让你死,一起死。 这样的战略使合作成为可能。
另一个时间的扩展不是单纯重复一次游戏,而是不断扩展的游戏,一次游戏用两个个体行动,但在延伸的游戏中,先来,我再来,你再来,和象棋一样。
在这样的游戏中,有简单的纳什均衡,可以从最终结果中找到符合纳什均衡的解。 但是,有些纳什均衡实际上是不会发生的。 你做了什么决定了我在这一步能做什么。 这种均衡是考虑到了实际排除的真相。 所以,需要新的均衡概念。
每次自己去,我们面前都有别人的行动,这是事实。 我们用照相机行动。 我们应该做的是去看。 现在给予前面的行为,我们能做的最好的事是什么? 在前一步采取别的行动可能会更好,但不能改变事实。 我们能做的就是现在我能做的最好。
寻找这种游戏的均衡是从最后一步开始,逐步前进,前进到最初。 完全是新闻,双方依然可以知道每一步最合适的战略是什么。
3 .静态非完全新闻游戏
上述是向时间维度的展开。 从简单的完全新闻游戏变成不完全新闻是另一种情况。 在这种情况下,我们对对方的消息一点也不了解。 例如,其收益函数或其喜好。
在这种情况下,如果对方不能预知在给出的行为下最好的战略,我们只能给对方不同的战略概率,然后根据该概率推测选择自己的战略。
点球也以例子。
对门将来说,他不知道投篮者的喜好,只是估计这个喜好。 如果是右撇子,我推测这个选手踢门左边的策略有点大。 好吧,根据这个估计,他会以更大的概率朝这个方向击球。 但是投篮的人有可能朝完全不同的方向踢。
另一个例子是投标购物。 买方喊买方的时候,因为不知道卖方心中的合适价格,所以害怕喊得很高。 同样的理由,如果卖价高的话,可能会低的喊。 这样的游戏都是非完全新闻的游戏。
事实上,在现实世界中,大部分游戏都是不完全的消息。 在完全的消息下世界是美好的,除非在完全的消息下,问题会多而杂。 如果我知道女儿喜欢我,女儿知道我喜欢她,在这个世界上寻找真爱的效率会提高多少?
4 .不完全新闻的动态游戏
考虑到时间的多元性、复杂性和新闻的不对称,这是博弈论中比较多和复杂的情况,也是经济学家研究最多的行业。
如果新闻不对称,我们自然会考虑用某种方法传播新闻。 这里假设我们不能直接告诉对方或者不想告诉对方,故意迷惑对方。 那么,在动态游戏中,这种新闻发布是可能的。
这是博弈论中最典型的“信号游戏”,signaling game,斯宾塞( michiel spence )是最早的发明者,是1971年的论文。 2001年与斯蒂格利茨、艾伦的丈夫阿克洛夫获得诺奖。
signaling又多又杂,在这里总结一下。 双方,一方不知道另一方的某个特征,不知道是什么类型,但可以用之后的信号推测该类型。
例如,在求爱的例子中,如果一个女孩选择了对象,无法确认追求者是否真的爱上了她,她就需要用来自追求者的信号来评价。 在说明真爱方面,我爱你也没用,所以需要其他的行动。
发出信号需要价格,要说明真爱,需要发出足够价格的信号来强调你和别人不同。 在这样的游戏中,均衡是什么样的呢?在两种情况下。
一个是什么样的坚强的爱人和什么样的温和的爱人竞争着消费价格说明真爱,最终,停止到某一瞬间,什么样的温和的爱人发现,不值得再投入,这时,爱的足够深的人赢了。 这叫做“分离均衡”。
一是,到最后,两个人也没有完全区分,一点也不爱的人也混入真爱,继续消费价格发送信号对谁都没有价值。 女儿索性选择了身体结婚。 这叫做混淆均衡。 我发现后者可能是现实世界的状况。
在这个经典游戏的基础上,经济学家们还在研究那个发送信号没有价格的均衡会怎么样。 这是cheap talk。
近年来,诺奖不断发生的机制设计行业是基于这个行业展开的。 博弈论喜欢让人们研究人们的互动本身,预测结果。 机构的设计相反,是研究什么样的机构能达到特定的结果。 具体来说,在上述信号游戏中,研究让人们诚实报告而不是隐瞒自己的真相的方法。
上面说了很多简单游戏,杂游戏会变成两个纬度,一是新闻完全不完整。 一个是从静态的一次改为动态的多回合。 另外,从游戏玩家的数量变成2人到多人(本质上是游戏双方)的非常经典的博弈论模型也可以称为全球游戏( global game )。
global game在政治学和经济学中都有古典的应用。 前者,比如革命集团合作,你是否暴露,不仅取决于政权有多脆弱,还取决于你相信别人是否参与。 经济学上的好例子是银行兑换。 是否兑换取决于别人是否兑换,以及银行有多少钱。 在这个游戏中,主观因素变得更重要,往往具有实现自我预言的优势,内涵相当精彩。
总的来说博弈论是相当强大的思考工具和做法论。 理论虽然多而复杂,但其内涵在日常生活中,不难理解。
当然,学习博弈论的最好方法可能是谈谈一些恋爱。
本文作者:以纽约为支点,全球线网上交流,推进金融学术交流,加强金融经验分享,培养金融创业者,实现金融商务合作。 )
本论文允许作者独家采用本财经,请勿转载。 发表的发言不代表本站的观点。
“全球资讯眼”是本财经的全球记者和撰稿人团队给你看的原创专栏集。 真相比价值观重要得多。 全球资讯眼微信公共平台:关注全球资讯眼。 扫码更方便。
调查: 1980年以后的城市骨干,压力大吗?
以纽约为支点,全球线网上交流,推进金融学术交流,加强金融经验分享,培养金融创业者,实现金融商务合作。
标题:财讯:谈恋爱也要学会纳什的博弈论
地址:http://www.china-huali.com/cjxw/9227.html