德扑AI之父请来了最棒的博弈论学者们，他们能与 AI 擦出怎样的火花？｜ AAAI 2018

2025-08-08 02:36:45

导读美国外地工夫 2 月 3 日，AAAI 2018 在第一天的预热之后逐步繁华了起来。雷锋网 AI 科技评论在前瞻报道中提到过，本次大会将会有 15 个 Workshop 陆续停止，其中《非对称信息博弈的 AI（ AI for Imperfect-Information Games）》就是其中一个。这一 workshop 的组织者包括 CMU 的 Noam Brown, DeepMind 的 Mar

美国外地工夫 2 月 3 日，AAAI 2018 在第一天的预热之后逐步繁华了起来。雷锋网 AI 科技评论在前瞻报道中提到过，本次大会将会有 15 个 Workshop 陆续停止，其中《非对称信息博弈的 AI（ AI for Imperfect-Information Games）》就是其中一个。这一 workshop 的组织者包括 CMU 的 Noam Brown, DeepMind 的 Marc Lanctot 还有南加州大学博士生、曾获谷歌 PhD 奖研金的徐海峰。

就像 AlphaGo 让大家愈加熟知深度学习，大家对非对称信息博弈开端理解并熟习，很大水平也是由于 2017 年终，CMU 计算机系在读博士生 Noam Brown 和计算机系教授 Tuomas Sandholm 结合研发的 Libratus 在单挑有限注德州扑克（ heads-up no-limit hold’em）人机对战中完胜人类选手。在去年的 NIPS 2017 上，最佳论文正是由他俩的协作论文《Safe and Nested Subgame Solving for Imperfect-Information Games》所摘得。雷锋字幕组也曾对这一论文解读视频停止独家编译。

正像 Noam Brown 和 Tuomas Sandholm 在 Reddit 上所表达的那样：深度学习远非人工智能的全部，非对称信息博弈也与 AI 联络得越发严密。「非对称信息博弈」常被用来模仿触及隐藏信息的各种战略交互（例如会谈，拍卖等）和平安交互中。由于隐藏信息的存在，处理这些事情需求的办法与传统的对称信息（比方国际象棋或棋类游戏）完全不同。虽然在一些研讨「非对称信息模仿」的范畴获得了相当大的停顿，但是每个范畴所运用的技术虽然具有普遍性，却依然绝对孤立。它们之间存在充沛的跨学科交流的时机，让研讨人员们会经过曾经在一个范畴中盛行的办法的新使用、或运用树立在不同范畴中已无方法来创立新的技术。

本场 Workshop 的次要话题简直包括了「非对称信息博弈的 AI」相关的大局部内容，包括早先用于 AAAI 年度计算机扑克竞赛（ACPC），用于处理大型不完满信息游戏的可伸缩算法，游戏中的对手建模和开发，普通和多于两个的算法建模和剖析信息非对称在游戏中的作用，战略信号（又名压服），在不完好信息的战略环境中停止探究与开发，以及一些与非对称信息博弈有关的其他主题的研讨。

研讨者们将分享他们在研讨 AI 在非对称信息博弈中的实际和理论方面以后的研讨效果，也提出有关如何改善相关范畴算法的设想，推进该范畴的 AI 研讨。

这场 Workshop 继续了一整天，原方案是早上 9:30 收场，下午 5:00 完毕，有 8 个演讲者对他们的研讨效果停止分享，每人限时半小时，以下是原定议程：