说一下为什么要写一款军棋游戏。这是之前说到的,爸爸给小朋友制作的一个玩具。男生一般都喜欢军事游戏,这是其一。 双人对弈的暗棋,是不完全信息博弈在对局中的充分体现。
暗棋的布局阶段,信息天然不对称,双方互相不知道对方的底牌(军棋位置)。
行棋阶段,通过棋子的碰撞解锁信息,每一次对抗生成新的公共信息。
层级压制,玩家需要权衡每一次攻击的风险和收益。
德国经济学家和博弈论学者纳格尔Nagel,有一个认知层级理论(CHT, Cognitive Hierarchy Theory),认为人类的思维是分层的。 Nagel把人的思维分为:
Level-0(非策略性玩家):随机决策或者基于简单直觉(如随机出价)。
Level-1(初级策略者):假设对手是Level-0,并优化自己的策略(如“猜数字游戏”中猜50的2/3≈33)。
Level-2(中级策略者):认为对手是Level-1,并进一步调整(如猜33的2/3≈22)。
Level-3+(高阶策略者):递归思考,预判对手的预判(如职业扑克玩家的诈唬策略)。
我在设计游戏时,增加了一个“自动布局”的功能,以方便游戏快速开始。
对于Level-0玩家来说,自动布局是一个很好的选择。他们通常不会再花时间去思考布局,或者仅对棋子位置做很少的调整。 在不考虑对手策略情况下,随机移动棋子。
对于Level-1玩家来说,会假设对手是一个Level-0的玩家,因此推断对手的行棋具有随机性,进而采取的策略是用大子比如司令进攻,使用激进策略。同时Level-1玩家看起来会缺少一些耐心。
对于Level-2玩家来说,假设对手是一个Level-1的玩家,推测对手会采取激进策略,进而采取保守策略,采用炸弹或地雷防御。由于防御策略的采用,Level-2玩家相对会采用更多的时间进行布局。
Level-3及以上的玩家则会表现出更高的复杂性,具有典型的“老狐狸”的特征。 或者他会使多枚棋子表现出具有相同的特征,尽量减少对手通过自己棋子的移动来获得信息。而低阶的玩家,则会使自己不同军衔的棋子透露出行为上明显的差异性。 或者他会用低级棋子(如排长)伪装成司令,诱骗对手浪费炸弹;或者布下炸弹陷阱引诱对方司令或者军长进入。
Nagel假设人群思维层级的符合“泊松分布”,在实验中发现Level-1和Level-2的玩家占比最高,同时Level-0的人数大于Level-3+的玩家。从心理学角度看,人类的递归思考需要耗费大量脑力、信息收集与知识储备,因此高阶玩家自然稀少。
CHT理论,相较于纳什均衡,个人认为更具有场景意义。纳什均衡假设人类行为理性,而CHT理论认为人类的思维是分层的。
举例来说,股市中常说收割韭菜,原因就在于低阶玩家通常倾向于“追涨杀跌”,这一模式容易被人预判和利用。 而为了避免被收割,低阶玩家会选择“反向操作”,但这又会被高阶玩家预判和利用。 因此,低阶玩家的反向操作又会被高阶玩家利用,形成一个循环。
不完全信息博弈思维的培训,可以融合在游戏中。
在为小朋友写的军棋游戏中,我设计了以下功能,来锻炼思维能力:
- 自动布局:可以快速开始游戏,但如果依赖于自动布局,就会尝到屡屡输棋的后果。Level-0玩家的胜率显著地低。
-
行棋阶段:
己方被吃的棋子仅自己可见,对方被吃的棋子自己不可见,仅能看到对方被吃掉的棋子的数量。高不透明度的信息,使得要赢棋的话,需要仔细分析对方的行棋。
双方都可以在对手在棋盘上的任何棋子做出标记,方便观察对手特定棋子的路线和行棋风格。
- 回顾阶段:
本局游戏结束后,双方可以回顾本局游戏的行棋轨迹,以明棋的方式。通过对局回顾,可以分析对方的行棋风格和习惯,提高自己的博弈能力。