152 纳什均衡第2/2段
合作才能对抗强敌。只有乙丙合作,才能把甲先干掉。如果,乙丙不和,乙或丙单独对甲都不占优,必然被甲先后解决。
“队长,虽然我能听懂但确实有点复杂,能不能讲的简单一点。”
“那换石头剪刀布,总能明白了吧。”
假设玩家A和B在玩石头剪子布游戏,玩家A石头剪刀布概率分别为(1/2,1/4,1/4)。那么B玩家可以随意选择策略,比如(1/3,1/3,1/3),可以算一下玩家B获胜概率为:1/3x1/4+1/3x1/4+1/3x1/2=1/3,同样平局概率为1/3,获败同样为1/3。这样1局净胜0。
如果B玩家足够聪明,就会选择(1/4,1/4,1/2)这样的策略。此时玩家B获胜概率为:1/4x1/4+1/4x1/4+1/2x1/2=3/8,平局概率为:1/4x1/2+1/4x1/4+1/4x1/2=5/16,负局概率为:1/4x1/4+1/4x1/2+1/4x1/2=5/16。这样1局净胜1/16。
我们很容易知道这已经是玩家B的最优策略。
任何玩家都不能仅通过仅改变个人策略来改善他们的结果,也就是说,这样的策略组合达到了纳什均衡。但明显玩家A并不是最佳策略,他又该切换到(1/4,1/2,1/4)的策略,继而B调整策略,无限下去……
只有A、B均采用(1/3,1/3,1/3)时,双方无论怎样都无法再提升自己的收益,这才是一个稳定的纳什均衡点,这在经济学上便是制度的公平。
“这么说,我似乎就明白了。”
“其实德州扑克在数学上是一个典型的多人非合作不完全信息零和博弈问题。在我眼里,我只会算每个玩家有多『蠢』,以及对应这么『蠢』的玩家,最优策略是什么。德州扑克就是一个复杂了无数倍的剪刀石头布,我说的『蠢』没有贬义的意思,指的是类似于剪刀石头布中偏离(1/3,1/3,1/3)的程度。”
“你这么说,是想象的还是真实的呀?德州扑克怎么会是剪刀石头布呢?”
“看这条2019星年7月的《自然》杂志,题目叫作《人工智能在多人桌德州扑克比赛中战胜世界顶尖选手》。”
Pluribus人工智能扑克机器玩家击败了人类顶级职业扑克手,我们看一下更早的Libratus,它的成绩是以每100手14倍大盲(14bb/100)单挑完胜世界级人类玩家。
以下引自Libratus之父:
我们(科学家)在推算AI离打出一个博弈理论中的最优化策略还有多远。我们有很多方法来计算这一数值,但代价极其昂贵,所以到现在都还没实现。也许我们明年会开始尝试。如果非要我推测的话,我猜一个博弈理论中的最优化策略可以以15bb/100 战胜Libratus。这是我的粗略估计,范围应该在5~50bb/100。
“所以,我一直在不断地评估我的策略的有效性,针对当前这样一个环境及对手,怎样从数学期望上赢得最多,也就是最大程度利用你们的弱点,获取最大利益。不得不说,这让我很是痴迷。”元一呷了口石榴汁道。
“果然我们玩的不是一个游戏啊,那句话怎么说来着,有时候感觉人与人的差距,竟然比人和猴子还大。队长我们在你眼中,是不是就是一种会说人话的滑稽猴?”
“不会啦,数学远不是生活的全部,每个人有自己的独特意义与价值。你不是歌唱得挺好,还懂不少医学吗?”
本章节已阅读完毕(请点击下一章继续阅读!)