DeepMind将博弈论融入多智能体研讨，让纳什平衡变得更复杂

2025-08-04 14:46:57

导读雷锋网 AI 科技评论按，随着 AI 零碎在理想生活中变得越来越重要，我们自然该探究不同零碎间的交互方式了，这些多智能体间究竟用了什么共同的方式呢？在 DeepMind 的最新论文（宣布在 Scientific Reports , Nature 出版社旗下杂志）中，研讨人员用了博弈论来说明这一成绩。雷锋网(大众号：雷锋网)理解到，详细来说，他们研讨了两套智能零碎在非对称博弈游戏（asymmetri

DeepMind将博弈论融入多智能体研究，让纳什均衡变得更简单

雷锋网 AI 科技评论按，随着 AI 零碎在理想生活中变得越来越重要，我们自然该探究不同零碎间的交互方式了，这些多智能体间究竟用了什么共同的方式呢？

在 DeepMind 的最新论文（宣布在 Scientific Reports , Nature 出版社旗下杂志）中，研讨人员用了博弈论来说明这一成绩。雷锋网 (大众号：雷锋网) 理解到，详细来说，他们研讨了两套智能零碎在非对称博弈游戏（asymmetric game）中的反响和表现，这些游戏包括 Leduc 扑克和一些图版游戏（如 Scotland Yard）。

在理想生活中，我们会遇到许多相似非对称博弈游戏的场景，自动拍卖（automated auction）就是其中之一。在这一进程中，会混入许多 AI 扮演的买家或卖家，而真正参与其中的人类买家和卖家也都有本人的小算盘。最终的测试后果让研讨人员对这种奇异的状况有了深入理解，他们还拿出了一个相当复杂的剖析办法。

虽然 DeepMind 的次要目的是如何将博弈论使用到多个 AI 零碎的交互中去，但研讨人员得出的后果也可以用在经济、生物退化和实证博弈论等学科中。

众所周知，博弈论是数学界的分量级实际，研讨人员通常会用它来研讨竞争态势下决策者们的战略，该实际简直可通用于人类、植物和计算机世界。不过，在 AI 研讨中，它普通会被用在“多智能体”环境下的研讨中。举例来说，多款家政机器人协作清洁房间就属于其中的使用场景之一。

普通来说，多智能体零碎的演化动力学都靠复杂的对称博弈论来剖析，比方经典的囚徒窘境实际。虽然此类游戏能帮我们对多智能体零碎的任务方式有一定理解，并通知我们如何完成你好我好大家好的理想后果（即所谓的纳什平衡），但却无法模仿一切状况。

DeepMind 的新技术让研讨人员能疾速容易地在更复杂的不对称博弈游戏中找到获得纳什平衡的战略，这类游戏中玩家通常有不同的战略、目的和奖励。假如你想理解 DeepMind 是如何用新技术“破解”这类游戏的，可以试着去理解“性别博弈”，它也是博弈论研讨的经典案例之一。

在“性别博弈”中，两个玩家要协调早晨究竟去哪玩，是去看歌剧还是看电影？令人遗憾的是，他们中有一团体倾向于看歌剧，另一团体则偏爱电影。这样的情境下，不对称的状况就呈现了，由于即便两团体达成分歧，其中也有一团体会不快乐。因而，要想持续维持两人的友谊（划掉），或许说平衡，玩家就该共进退（毕竟发生分歧换来的只要零报答）。

DeepMind将博弈论融入多智能体研究，让纳什均衡变得更简单

这个游戏有三种“势均力敌”的平衡状况：

两个玩家都决议去看歌剧，

两人都选择去看电影，

则是混合选项，即每位玩家在夜晚外出的五分之三工夫内享用本人的心头好。

第三种选项是一种“不波动”（unstable）选项，用 DeepMind 的办法很轻松就能停止简化或许分解，非对称博弈游戏也就转换成为对称的对应局部。这一办法将两个玩家的奖励表辨别当作独立的双玩家对称博弈，这样也能轻松地找到本来不对称博弈游戏的纳什平衡点。

在下图中，b 和 c 图的纳什平衡点很容易找到，借助它们我们就能在非对称博弈中找到 a 图中的最佳战略。当然，我们也可以反过去，经过非对称博弈来找寻对应体中的均衡点。

DeepMind将博弈论融入多智能体研究，让纳什均衡变得更简单

红点代表纳什平衡。关于非对称博弈游戏(a)，可以从(b)与(c)代表的两个对应图中找到纳什平衡。如图所示，x轴和y轴辨别代表玩家1和2选择看歌剧的能够性。

这种办法还可运用于其他游戏，比方 Leduc 扑克，在论文中研讨人员还对它停止了详细解读。无论哪种状况下，这种办法都足够复杂，它能帮玩家疾速和直接的剖析非对称博弈游戏，进而协助我们了解不同的静态零碎，其中就包括多主题环境下的零碎交互。

Via. DeepMind

论文地址： https://www.nature.com/articles/s41598-018-19194-4 , 雷锋网编译

雷锋网版权文章，未经受权制止转载。概况见。

免责声明：本文章由会员“何俊东”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：