搜狐首页 科技 无心法师2

手机搜狐

SOHU.COM

如何像人工智能那样“算计”别人

计算机精于计算,这是比特世界的规则;

而人类精于算计,这是原子世界的法则。

在科幻小说《三体》中,地球人自知在科学技术方面远不及三体人,但最后靠隐藏真实策略,勉强赢得了局面均衡。

如果要这么说,人工智能应该永远无法战胜人类,因为人类能够进行逻辑推理之外的策略。

可现实真的如此吗?

本月初,在一场德州扑克的人机对抗大赛中,由卡内基梅隆大学教授和学生共同打造的AI系统Libratus,完胜4位顶尖人类棋手!

WTF?

大家都知道,赢得德州扑克靠的不是逻辑计算,而是欺骗,是算计。

可计算机不会算计啊,只能基于牌面信息进行逻辑推演。

扑克牌和象棋、围棋的本质区别在于,它的信息不完整性。因为信息的不完整,才会有欺骗、算计——这些恰恰是人类的特长。

这种技能不是一场牌局可以获得的,而是几十年生活经验的积累。

这也是为什么象棋和围棋的高手通常会在20多岁达到一个巅峰状态,而扑克的高手尽是些老头儿。

当然,除了发哥。

那人工智能到底是怎么赢的呢?

尽管拥有深度学习能力,但AI思考的本质还是逻辑推演。

人工智能通过什么逻辑,使它在信息不对称的情况下也能比人类更胜一筹?

要知道,信息不对称是人类世界的常态,

学习人工智能那样“算计”别人,意义重大,商业谈判、政治博弈,甚至日常生活中各种复杂的问题,

那都不是个事儿。

Libratus是一个复杂的决策系统,

要把它完全说清楚不太可能,AI的世界只有它自己懂。

不过我们可以把它简化,再简化。

牌手的每一步决策,依赖于两类信息:

第一类是「已知信息」,即桌面上和自己手中的牌,以此可以推断出基本的获胜概率。

这种计算并不复杂,一些稍有经验的牌手也能做出准确判断。

第二类则是非透明的:「对手策略的判断」

最常见的是:他的加注是因为真的有好牌,还是虚张声势?

这关系到对手是个怎么样的人,

以及对手会认为我是怎么样的人,

以及对手会认为我认为他是怎么样的人

……

说到底就是识人,是算计。

对于人类来说,要知道对手是诚实,还是欺骗,

这得基于对手背景信息的理解——高度复杂和非结构性的海量数据,

所以我们喜欢用一种叫“经验”的东西,

但对计算机来说,必须建立一套核心策略,进行大量计算。

那么这个核心策略是啥呢?嘿嘿,先卖个关子,

这得从博弈论的理论基础谈起……

(以下片段并不枯燥,读者切勿走开!)

精选