甲会这样推理:假如乙不招,我只要一招供,马上就可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢10年,他却获得了自由,而我招了也只坐8年,显然还是招了好。可见无论乙招与不招,甲的最佳选择都是招供。所以,甲想:还是招了吧。
于是,甲知道该怎样做了。但是,别忘了:相同的逻辑对另一个人也是同样适用的。因此,乙也会毫不犹豫地选择背叛——也就是招供。
这样一来,甲、乙两人都选择招供,这对他们个人来说都是最佳的决定,即最符合他们个体理性的选择。而他们各自最理性的选择,给他们带来的并非最佳结果(自由),也非较佳结果(1年刑期),而是比最坏结果(10年)要略好的结果(8年刑期)。顺便提一下,这两人都选择坦白的策略以及因此被判8年的结局被称作是“纳什均衡”(也叫非合作均衡)。所谓纳什均衡,指的是参与人的一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。纳什均衡是博弈论的一个重要概念,以普林斯顿大学数学博士生约翰·纳什命名。