不要让我们的对手有迹可循
有个成语叫做“按图索骥”,其意思便是按照一定的线索寻找自己的目标。在博弈分析的时候,按图索骥便是一种很好的方式,依据对方的得益推断出对方的策略方向,再依据对方的能力和理性推断出对方的策略范围。最后,根据对方的策略方向和范围很容易就可以推测出对方的策略选择。
上述内容其实就是寻找纳什均衡的一种方式,虽然这是一种很好的博弈分析方式,但遗憾的是并不是所有的博弈都存在纳什均衡。当我们遇到不存在纳什均衡的博弈时,之前的分析方法便无法明确地给出建议,那么此时应该怎么做呢?回想一下,之前的分析都是建立在“理性经济人”的假设基础之上,所以每个博弈方都可以最大限度地搜集自己所需要的信息,但同时我们也知道实际生活中是不可能出现这种状况的,理论和实际的差别就提供了解决问题的方向——信息。
两个人在猜硬币,只要猜对对方扣在手中的硬币是哪一面向上,就可以取得胜利。如果单纯从策略方面分析,两人的策略都是两种:正面或者反面。不论双方选择哪一种策略,都无法保证自己的胜利,这场博弈完全没有明确的、可预测的结果,因为双方并不存在可以形成纳什均衡的策略组合。那么,是否就意味着这场博弈我们完全没有展开分析的可能,只能胡乱地决策呢?显然不是。虽然这里的分析对于预测结果没有什么意义,但是却引出了一个博弈当中十分重要的原则:绝对不能让自己的策略被对方预先了解或者猜到。就拿上面的猜硬币来说,如果猜的一方知道了扣的一方的策略,那么他就会准备好相应的答案。同样如果扣的一方知道了猜的一方要怎么回答,那么他也可以故意放成相反的样子,这样就能保证自己的胜利。这是博弈当中必须遵守的原则,除非我们一门心思想输。
由此我们可以初步推出,必须要隐藏自己的策略选择,最佳的方式就是在扣硬币的时候变得没有规律。如果我们总是一正一反或者说两正一反这样带有规律性地扣硬币,那么一旦对方摸清了我们的规律,就可以有针对性地制定策略,从而让我们输得一塌糊涂。所以,我们必须让正反面的出现变得毫无规律。但是这样做就足够了吗?当然不行。
还记得上初中时看不懂完形填空的时候是怎么处理的吗?就是整道题的所有选择都选同一个选项,所以经常会在试卷上看到一连串的a或者一连串的b。那时候我们不懂别的,只知道这样做最少也可以蒙对四分之一。这又说明了一个问题,虽然我们的正反面出现变得没规律了,但是总的来说正面出现的次数要大于反面出现的次数,那么如果对方一直选择正面的话,自然也会赢多输少。在重复博弈当中,博弈的得益是最终得益的总和,所以输多赢少的我们自然是这场博弈的输家。因此为了让我们的对手不至于蒙出好运气来,最佳的选择就是在没有规律的基础上让正反两面出现的次数一致,这样对方就无法利用我们的偏好来赢得胜利。同时作为猜硬币的一方,也可以采取同样的策略,使得不论对方做什么样的选择,都可以保证自己不输。如果双方都采取同样的策略,那么就会形成一种平衡,我们可以姑且称之为“混合策略纳什均衡”。
所谓的混合策略,就是不同策略出现的时间随机分布。如果出现的次数达到一定的平衡,就是我们所说的混合策略纳什均衡。相对而言,之前在动态或者静态博弈当中的策略就可以被称作是纯策略,而之前的那种均衡也可以被称作纯策略纳什均衡。如果在一场博弈当中找不到纯策略纳什均衡的话,找到混合策略纳什均衡也是一样有效的。
因为博弈论而获得1994年诺贝尔经济学奖的塞尔顿教授在一次演讲中讲过一个小偷和守卫的例子:
小偷想要去偷窃一个仓库,如果守卫正好睡着了,那么就会偷窃成功,但守卫会被解雇;如果守卫没有睡着,那么他就会因为偷窃失败而被抓,小偷就会坐牢。这里面小偷有两种策略选择——“偷,不偷”,而守卫也有两种策略选择——“睡,不睡”。
如果小偷选择“不偷”,守卫也选择“不睡”,那么两者相安无事,但是守卫却失去了一次偷懒的机会。而如果小偷选择“不偷”,守卫选择了“睡”,那么小偷则失去了一次可以得益的机会。所以两者在制定策略的时候一定要考虑到对方的选择。当小偷选择“偷”的时候,守卫最佳的选择就是“不睡”,因为如果被偷了,他就会失去工作。而守卫选择“不睡”的时候,小偷的最佳选择就是“不偷”,不偷相安无事,偷了就得去坐牢。而小偷选择“不偷”的时候,守卫的最佳选择肯定是“睡”,反正闲着也是闲着。抛开道德之类的影响因素之后,无论从哪里开始,都会逐渐形成这样一个循环。但是小偷和守卫都是有限理性的人,所以我们不能期待这么一个循环的出现来证明自己的推断。
事实上,当小偷决定一段时间“不偷”之后,守卫就会逐渐放松警惕,从而天天选择“睡觉”,这时候小偷就可以抓住机会去“偷”。而当小偷经常光顾仓库,新来的守卫得知之前守卫的下场之后,就会天天选择“不睡”,这样小偷就只能选择“不偷”。至于为什么不是“被抓”,是因为小偷具有一项特权,那就是决定什么时候出现。小偷不出现,守卫即便知道小偷的存在,也无可奈何。
在这场博弈当中,双方最重要的就是不能让对方知道自己的策略选择。所以对于知道小偷存在的守卫,最佳的办法就是假装“睡觉”,然后引出小偷来“偷”,这样就可以一劳永逸。这虽然不符合博弈理论,但却不失为一种在博弈中取得胜利的办法。在博弈理论当中,守卫在明知道小偷会来偷东西的时候睡觉,显然是一种下策,而下策是绝对没有人会去选择的。如果我们把“假装睡觉”算在策略当中,那么按照理论来说,小偷也可以采用“假装偷”的策略来应对,这就会让我们的分析陷入一个死胡同。所以对理论的应用要灵活多变,而不是生搬硬套。
小偷和守卫这个模型主要解决的就是管理问题,管理者和被管理者就可以看做是守卫和小偷。把之前小偷被抓记作得益a,成功偷到东西记作得益x,守卫被处罚记作得益b,睡觉而没有被罚记作得益y。为了解决小偷偷东西和守卫睡懒觉的问题,只需要加大得益a和得益b就可以了。当得益a变大的时候,小偷就会得出a+x是负数的结论,这时候小偷的策略倾向就会选择“不偷”。小偷不偷的结果就是守卫的工作变轻松,也就意味着管理者的工作变得轻松了,同时管理者的数量就可以减少。当管理者的数量减少之后,被管理者对管理者的监督就变得更加严格和仔细(因为小偷有决定什么时候出现的特权,所以一旦守卫选择睡觉,小偷随时都可能偷东西),也就减少了管理者的偷懒问题。十个人监视一个人肯定会比一个人监视一个人要轻松得多,长期下来就会形成一个良性循环。
在博弈当中,我们不仅要重视其他博弈方信息的获取,还要重视己方信息的保密。这里说的保密并不是说不要让对方看到自己的策略就可以,还要保证对方猜不到自己的策略,也就是达到前面所说的混合策略纳什均衡。相比较纯策略纳什均衡而言,混合策略纳什均衡更具有实践意义。通俗地说,就是不采用单一的策略,而是多管齐下,用多种策略来应对对方。日常生活中大家其实就是这么做的,用一句古话说,这叫做“明修栈道,暗度陈仓”。在多种策略当中,有迷惑对方的,也有误导对方的。在通信发达的现在,想要完全隐藏自己的动作是不可能的,那么我们能做的就是迷惑对方,让对方无法判断出我们的真正意图。
把对手引到歧路上,就相当于隐藏了自己的踪迹。