博弈论的最佳解决方案:关于GTO扑克的几点思考(下)
当每个人都知道别人在做什么的时候
严格来说,一旦您处于三人或者多人底池里时,就没有博弈论的最优解。
这是因为没有稳定的平衡(或者平衡过多难以计算,取决于您针对的对象)。
玩家始终可以相互适应,或者从试图执行GTO扑克策略而不懂得调整的玩家那里获得优势,这个过程在Bill Chen和Jerrod Ankenman在2006年出版的《扑克数学》中称之为“隐性伙牌” 的过程。
因此,多人底池没有那种不受剥削的策略。
在进行单挑游戏时,如果你(或机器人)遵循GTO扑克策略,则从长远来看,无论对手做什么,对手都无法击败您。
这并不意味着您在与该对手的对抗中赢得了最大的胜利,而是在长期的平局中立于不败之地,同时仍然受益于对手的一些失误。
例如,限注德州扑克GTO机器人经常会在河底经常用底对去跟注,因此您无法有效地诈唬他。
如果你从不诈唬,那么该机器人仍会以相同的频率来跟注支付你。然而一个懂得剥削的玩家会在一段时间后停止跟注,并赢得更多。
扑克职业玩家和扑克培训网站的创始人Doug Polk在TwoPlusTwo Pokercast上发表了有关人与机器NLH比赛中的这种情况。
尽管玩家们发现计算机玩得不错(根据Polk称,与常规对手相比),但它却没有尝试去剥削玩家们的下注方式,这让玩家们感到宽慰。
如果你击中坚果并且下注1.5倍的底池或更多,那么AI不会知道或不在乎。它只是玩GTO扑克。
在一个理想的3人以上的游戏中,玩家们互相适应对手,GTO不起作用。但是在实践中,如果玩家没有过多地改变自己的策略(并且他们也没有这样做),那么许多适用于单挑的博弈论原则就适用了。
我的一个朋友与世界上最好的在线扑克玩家之一正好一起读研究生,他有幸观看到他的打法。
他惊讶于他的同学没有做出任何不寻常的打法,或者根本没有做出任何“动作”。根据这位扑克职业玩家的说法:
l 每个人都知道我是谁
l 每个人都知道我怎么玩
l 没有任何理由去非常规操作
如果将Chen和Ankenman关于“隐形伙牌”的想法牢记在心,那么还可以补充一点:如果玩家与其结盟而不是试图击败对方,那么职业玩家只会退出游戏。
这在流鼻血的游戏中是没有问题的,因为每个人都认识其他人,而且匿名或伙牌实际上是不可能的。
关键是,在线扑克中最好的玩家会玩GTO。他们必须非常善于知道什么时候下注80%跟注20%,何时下注20%弃牌80%。然后他们实际上也这么做了。
要执行得好,有很多话要说。(我认为20%的时候跟注按钮过于频繁。)
一旦机器人学习了所有正确的下注频率,就很容易理解为什么在同一次采访中Polk对人类的处境感到悲观。
因为计算机在执行方面将始终具有优势。
结论:GTO扑克是基准
在短期内,人类将更快地融合到GTO上。
当我坐在RIO酒店的亚马逊厅观看100万美元买入的一滴水赛事的决赛桌时,我震惊于进入到三人桌的时候,玩家打得如此松且被动。
我在Twitter上做了一些批评,以比较Daniel Negreanu,Dan Colman和Christoph Vogelsang之间发生的小下注,一路Check的打法和本地娱乐场小型卫星赛的区别,两者之间非常类似。
很多人反驳说这些家伙是世界上最好的扑克玩家,我显然是个白痴。
但可以肯定的是,似乎没有一个玩家试图向其他玩家施加压力。他们为什么这么做?有了1500万美元,800万美元,400万美元的奖金差距,筹码上升的好处明显比筹码下降的劣势要小很多。
另一方面,如果一个人施压,他就知道其他人会如何反击。所以没人施压。
在大约两个小时的时间内,世界上最好的短桌NLHE选手不断的下小注或者过牌,直到最短筹码的Vogelsang出局为止。
您需要用扑克GTO才能赢吗?或者更确切地说,你需要与最佳扑克游戏理论保持多近的距离才能使自己与强大的对手们对抗?
来让桑德霍尔姆教授,卡内基梅隆大学Claudico无限额德州扑克团队的带头人,回答这个问题。
在最近《Cigar Aficianado》对获得了年度计算机扑克冠军的学者和发烧友的采访中,桑德霍尔姆被问到阿尔伯塔大学的同事如何解决限注德州扑克。
桑德霍尔姆回应说:“他们说这基本上已经解决了。我认为这很重要。” “不过我的问题是:三年前该问题是否得到了解决?”
接近最佳的GTO扑克游戏只是第一步。
一旦您的基准策略无法被对手剥削,您就可以将其余时间用于研究对手的倾向并利用他们的弱点。
还是会有很多玩家不考虑范围,不对某些游戏信息进行调整或只是按照自己的方式来游戏。
针对他们才是GTO和扑克真正的目的。