I predicted your prediction

说一下为什么要写一款军棋游戏。这是之前说到的，爸爸给小朋友制作的一个玩具。男生一般都喜欢军事游戏，这是其一。双人对弈的暗棋，是不完全信息博弈在对局中的充分体现。

暗棋的布局阶段，信息天然不对称，双方互相不知道对方的底牌（军棋位置）。

行棋阶段，通过棋子的碰撞解锁信息，每一次对抗生成新的公共信息。

层级压制，玩家需要权衡每一次攻击的风险和收益。

德国经济学家和博弈论学者纳格尔Nagel，有一个认知层级理论(CHT, Cognitive Hierarchy Theory)，认为人类的思维是分层的。 Nagel把人的思维分为：

Level-0（非策略性玩家）：随机决策或者基于简单直觉（如随机出价）。

Level-1（初级策略者）：假设对手是Level-0，并优化自己的策略（如“猜数字游戏”中猜50的2/3≈33）。

Level-2（中级策略者）：认为对手是Level-1，并进一步调整（如猜33的2/3≈22）。

Level-3+（高阶策略者）：递归思考，预判对手的预判（如职业扑克玩家的诈唬策略）。

我在设计游戏时，增加了一个“自动布局”的功能，以方便游戏快速开始。

对于Level-0玩家来说，自动布局是一个很好的选择。他们通常不会再花时间去思考布局，或者仅对棋子位置做很少的调整。在不考虑对手策略情况下，随机移动棋子。

对于Level-1玩家来说，会假设对手是一个Level-0的玩家，因此推断对手的行棋具有随机性，进而采取的策略是用大子比如司令进攻，使用激进策略。同时Level-1玩家看起来会缺少一些耐心。

对于Level-2玩家来说，假设对手是一个Level-1的玩家，推测对手会采取激进策略，进而采取保守策略，采用炸弹或地雷防御。由于防御策略的采用，Level-2玩家相对会采用更多的时间进行布局。

Level-3及以上的玩家则会表现出更高的复杂性，具有典型的“老狐狸”的特征。或者他会使多枚棋子表现出具有相同的特征，尽量减少对手通过自己棋子的移动来获得信息。而低阶的玩家，则会使自己不同军衔的棋子透露出行为上明显的差异性。或者他会用低级棋子（如排长）伪装成司令，诱骗对手浪费炸弹；或者布下炸弹陷阱引诱对方司令或者军长进入。

Nagel假设人群思维层级的符合“泊松分布”，在实验中发现Level-1和Level-2的玩家占比最高，同时Level-0的人数大于Level-3+的玩家。从心理学角度看，人类的递归思考需要耗费大量脑力、信息收集与知识储备，因此高阶玩家自然稀少。

CHT理论，相较于纳什均衡，个人认为更具有场景意义。纳什均衡假设人类行为理性，而CHT理论认为人类的思维是分层的。

举例来说，股市中常说收割韭菜，原因就在于低阶玩家通常倾向于“追涨杀跌”，这一模式容易被人预判和利用。而为了避免被收割，低阶玩家会选择“反向操作”，但这又会被高阶玩家预判和利用。因此，低阶玩家的反向操作又会被高阶玩家利用，形成一个循环。

不完全信息博弈思维的培训，可以融合在游戏中。

在为小朋友写的军棋游戏中，我设计了以下功能，来锻炼思维能力：

自动布局：可以快速开始游戏，但如果依赖于自动布局，就会尝到屡屡输棋的后果。Level-0玩家的胜率显著地低。
行棋阶段：

己方被吃的棋子仅自己可见，对方被吃的棋子自己不可见，仅能看到对方被吃掉的棋子的数量。高不透明度的信息，使得要赢棋的话，需要仔细分析对方的行棋。

双方都可以在对手在棋盘上的任何棋子做出标记，方便观察对手特定棋子的路线和行棋风格。
回顾阶段：

本局游戏结束后，双方可以回顾本局游戏的行棋轨迹，以明棋的方式。通过对局回顾，可以分析对方的行棋风格和习惯，提高自己的博弈能力。