半街游戏是什么意思
半条街:半街游戏
在开始研究扑克的玩具游戏时,我们先考虑一个简化的系列游戏:半街游戏。半街游戏具有如下特性:
· 第一个玩家(通常我们称X)一般都是过牌
· 第二个玩家(通常我们称Y)可以选择过牌,或者下注一定量依据游戏规则
· 如果Y下注,X总是选择跟注摊牌或者弃牌(不能加注);而当Y过牌,那么X也过牌并且摊牌
我们这里会提到游戏的价值。这里就是假设双方都最优的时候,玩家Y的期望。我们只会考虑因为下注而产生流动的钱。这个价值就是摊牌前的价值。这里包括了X下注,Y跟注或者X成功诈唬而产生的盈利。
我们在研究这些游戏时,使用摊牌前价值,是因为我们不是特别在意游戏开始之前玩家动作的价值。我们试图寻求半街游戏里下注的价值。底池大小是5,10还是18并不重要,除非它与游戏里的动作有关。同时我们也注意到Y是不会有负期望的,因为他可以在后位过牌来实现0期望。
半街玩具游戏有至少一个非常重要的价值:我们可以解决它——实际上,我们可以解决任何半街游戏,只要他的复杂程度还可以。之后我们会看到,多条街的游戏经常会非常棘手,我们只能得到近似结果。而解决一些游戏是非常有价值的,因为我们可以用这些结论去理解一些更复杂的游戏。
我们要讨论的第一个游戏非常简单,它包含一个贯穿第三部分的概念——先知,玩家如果知道对手的牌,而不知道要发什么牌,那么他被认为是半先知;而如果他们既知道对手的牌,也知道要发什么牌,那么他们就是先知。这里因为没有牌要发,所以两个概念都适用。
牌例 11.1 –先知游戏
1.5条街
底池下注P
限注下注
Y是先知
Y的手牌是随机抽取的,其中一半可以赢X另外一半输。
在这个游戏里,X和Y都只需要做一个决定。这是大多数半街限注游戏的相似点。Y必须决定一个下注的范围,而X必须决定一个跟注的范围。X这个游戏里的“范围”包括了所有一样的牌,因为他只有一手牌可供选择。但是这并不是问题,下注和跟注的范围既可以包含特定手牌的混合策略也可以是单纯策略。
我们立刻就能发现Y在这个游戏里有信息优势;他可以用完美的比例价值下注所有能赢的牌(我们称之为坚果)并且诈唬一些会输的牌(我们称之为空气)。
这个游戏摊牌前的收益矩阵如下:
为了找出这个游戏的最优策略,我们需要牢记上一章里的一些原则。首先,我们考虑单纯策略,假设Y价值下注所有的强牌,过牌其他的。那么X就可以通过始终弃牌来剥削他。而一旦X这么做了,Y就可以调整成下注所有的牌(价值下注和诈唬)。而Y一旦这么调整,X也会变成永远跟注。所以Y可以通过下注所有价值牌和过牌一些弱牌来剥削他。
我们又得到了这个熟悉的摇摆单纯策略;这也意味着最优策略会是一个混合策略。这里有两个策略选项——一个对于X(用什么频率跟注Y),另一个是Y的(用什么频率诈唬)。Y需要永远价值下注坚果牌,因为这个选项主导过牌。X会跟注一定比例的牌,我们称之为c。类似地,Y会诈唬的比例我们称之为b。一旦我们找到b和c的值,也就找到了这个游戏的最佳策略。
我们轮流考虑这些决定。
首先,我们考虑X的跟注频率。当X使用最优策略时,会让Y的诈唬无差别(也就是说,Y弱牌的过牌与下注期望相等)。当诈唬的时候,Y如果成功则赢下底池p(如果X弃牌),如果失败则损失1(如果X跟注)。那么c这里就是跟注频率,而1-c就是X弃牌的频率,所以:
(底池大小)×(X弃牌频率)=(诈唬下注)×(X跟注频率)
P(1-c)= c
C = P/(P+1)
注意到随着底池大小的增长,跟注频率也增长。这也是一定意义上底池赔率的延伸,底池越大,X需要跟注的比例也在增加,从而阻止Y诈唬。
而对于Y而言,类似地,必须诈唬足够的频率而让X跟注和弃牌无差别。当跟注的时候,X损失1如果Y是价值下注,赢得P+1如果跟注了对手诈唬。假设b是诈唬频率,那么:
1 = ( P + 1 ) b
B = 1 / ( P + 1 )
%% P112结束
这个1/(P+1)是一个在分析扑克里是非常重要的值。重要到我们需要赋予它一个希腊字母α(alpha)。
α= 1 / ( P + 1 )(限注情况)
α这里代表两件事。首先X必须跟注足够频率从而让Y的诈唬和过牌无差别。X的跟注频率就是P/(P+1),或者1-α。因此α就是X当面对Y下注时的弃牌频率。另外,Y用α的频率诈唬,因为他会用100%的价值范围下注,所以α等于诈唬与价值之比,从而让对手的弃牌和跟注无差别。
类似地,1-α这个比例也很有意思:
1 – α = 1 – 1/(P+1)
1 – α = P/(P+1)(限注情况)
即使我们只介绍了限注情况,α可以被推广到不同下注大小的游戏里:
α= s / ( P + s )(各种下注大小)
s是相对于底池的下注大小(比如,在100的底池里下注50,s = 1/2)
注意到这里随着底池增长,α,诈唬比例随之变小;也就意味着,Y在大底池诈唬更少。这看上去比较违背直觉,实际上是因为大底池的成功诈唬收益更多了,但是这是最优打法的一个重要原则:
诈唬在最优打法里其自身经常是没有利润的打法。然而,混着诈唬和价值下注保证了最优打法在无论对手如何应对都可以获得价值。当对手过多弃牌则支付价值给了诈唬,而对手跟注过多则支付给了价值下注。
我们现在可以总结,这个游戏的最优策略是:
答案:
Y下注所有坚果牌和α的诈唬,或者全部牌的α/2
X跟注所有手牌的1- α。
摊牌前Y的游戏期望如下:他赢1个单位当他价值下注并且被跟注。回顾之前他手中一半坚果一半空气,因此他价值下注频率也就是1/2 。当他诈唬成功时,他赢下整个底池,而失败时也就是被跟注后损失1个单位。我们知道X会跟注足够的频率让他的诈唬无差别。他诈唬的期望因此就是0,而游戏的期望是:
< Y > = (价值下注频率)(价值下注大小)(被跟注频率)
< Y > = (1/2)(P/(P+1))
< Y > = P/2(P+1)
注意到随着底池的增长,X的劣势也随之增长;他必须随着对手价值下注频率更高而支付更多,而Y所需要让X跟注的诈唬却越来越少。同时,注意到Y半池下注是没有期望的,无论底池多大。因为当他价值下注到这个大小时,要求对手100%跟注。
先知游戏重要的特点就是存在下注诈唬和跟注比例,他们基于底池大小。Y下注的价值随着底池变大而增大。改变底池大小并且观察对于策略的影响是我们理解扑克非常有用的工具。我们甚至可以看一下当底池非常巨大时,没有玩家会弃掉任何有价值的牌时,会发生什么。