游戏里的人机对手,正在帮助人工智能走入现实
- 游戏研究社
- 2022年12月06日11时
AI与游戏的关系,随着近段时间人工智能的风头渐长,越来越常被人们提起。
但在谈到AI仍总会让人想起“模型”和“算法”等抽象词汇,还没能靠可视化被更多人看到的时候,它其实早就已经和游戏走到了一起。
作为一种与用户行为紧密相关的交互性媒介,游戏很容易给AI提供各种工具化的空间;同时因为它由规则与玩法搭建起舞台,逻辑严密的游戏本身又是天然适合AI生长和进化的土壤。
就算到了现在,仍有很多人还没意识到,二者的相遇从某种程度上来说是必然的。而且在过去的几年里,已经有很多团队用实例证明了这一点。
1. 游戏工具箱里的AI
如今聊起人工智能在游戏中的应用,很多人首先想到的是游戏制作中它能提供的帮助。
以MidJourney为代表的众多作图AI,确实已经被不少开发者逐渐运用到了实际的游戏制作中;微软最近申请了专利的AI作曲模型,听上去似乎也把游戏配乐的门槛拉低了不少;就连游戏内人物的对话,Open AI最近推出的聊天人工智能ChatGPT听上去也能胜任,似乎离RPG游戏里角色对话的完全智能化也不远了。
ChatGPT 号称“能接住人类抛给它的话题”
可这些距离我们普通玩家来说,始终还有一定距离。我们想要的,是能迅速应用到游戏中来改善游玩体验的各种工具——而这些也是AI能提供给玩家,甚至已经给到玩家的东西。
比如一个已经常用到足以被忽视的例子:围棋平台的AI陪练。
一开始当AlphaGo战胜人类棋手的时候,人们大都是感觉到AI对围棋界的冲击。但是反观现在,AI已经完全融入到了这个行业中,一个好用的AI陪练已经成了练棋的重要助手。甚至经过长时间的发展,已经细化出了各类产品,诸如“少儿围棋AI陪练”和“制定段位特训AI老师”都是针对不同人群的精准订制,就连中国国家围棋队也将腾讯AI Lab研发的棋牌类AI“绝艺”作为陪练。
在紧随围棋的电子游戏领域中,《星际争霸》《DOTA2》等项目上AI的胜利并没晚来多少,而在国内如今区别于市面上常见的游戏陪练的AI陪练也已经出现了。
《王者荣耀》中最近升级的“王者绝悟”,实际上就是一个AI伙伴。和其他游戏里高难度电脑主要靠操作和读指令不同,“王者绝悟”更多是通过多个AI间的不断切磋和试错,逐渐总结出规律摸索出最适合当下情况的操作准则。
对于MOBA玩家来说,如何拓宽自己的英雄池,练出足以拿到排位实战中的熟练度,而不在练习过程中成为队友口中的坑,一直是个难题。但在这个英雄训练营里,玩家们就不必再有类似的负担。
根据玩家水平不同,它会配置同水平的4个队友和5个对手,让玩家在最适合自己分段的对局里练习不熟练的英雄。除此以外,王者绝悟还有实现让AI接管角色的操控权、第一视角观摩AI操作的能力。
如果只是观看AI的操作,可能不会觉得有多厉害,但假若未来这样的功能实装到游戏当中,当玩家还能随时和AI的身份对调,就能更清晰地明白某些决策的意义。原本“看上去也没觉得多厉害,但就是打不过”的云玩家视角,也就变成了一个能用来提升熟练度、拓展英雄池的实用小伙伴。
而与此同时,对于人工智能行业来说,游戏如果只是AI的服务对象,那它们的联系远不会像今天这样紧密。因为在用AI提升玩家英雄理解能力,拓展英雄池,进而提升游戏体验的同时,游戏其实也是人工智能的天然训练场。
2. 穿透信息迷雾的AI
对于AI产业来说,游戏同时也是AI实现更多目标的手段。
面对复杂的现实环境,AI眼前并没有围棋中非黑即白的规则,或者是一览无余的一方棋盘。如何把海量信息间的规律总结提炼出来,在信息不对等的情况下做出决定,是AI投入许多领域都要面临的问题。
可正好,游戏就具备类似的完美实验环境。
游戏中的玩法规则,就是对许多复杂事物规律的总结和简化;不对等信息下的博弈,也是多人游戏这么多年发展不断玩出新花样的卖点。就像沙盘推演之于真实的战场,游戏也为AI提供了匹配度极高的实操舞台。
11月22日,Meta公司(原Facebook)旗下研究团队推出的一个AI,就在经典战略桌游《强权外交》上体会了一番复杂的训练环境。
在这款模拟列强瓜分欧洲大陆的战争游戏里,7名玩家需要各自为战,以吞下半个欧洲为目标努力。游戏虽然在桌游规则的概括下玩法称不上太复杂,但游戏中还有个完全左右胜负的重要功能,那就是与玩家打字交流。如何合纵连横,以口才发挥出自己有限兵力的最大优势,是Meta团队选择这个游戏的最大原因。
在这些人与人与人工智能间的博弈里,玩家可以选择公屏聊天,也可以选择一对一私聊。所以除了要处理已知信息并推断未知情报,还需要对谎言的存在做出合理判断。
在最后的结果里,这个名为Cicero的AI经过训练最终拿到了压倒性的胜率。更为关键的是,很多人类玩家甚至最后都没发现和自己有说有笑对局的对手,其实是个AI。
人类在游戏对局中思路和语言的多变,对于AI来说无疑是需要更多理解成本的东西,特别是当信息不对等时,猜忌链就会让问题进一步复杂化,不单单是“谁在第几层”的问题。
同样拿前面提到的“王者绝悟”为例,游戏里复杂的场景、多种英雄的组合和技能、策略的搭配,多方条件叠加产生的千万种条件里,还要预判对方的操作和动向,复杂环境下进行高效决策的能力自然就能得到更快的训练。
更重要的是,在这些条件下“己方规划的完美执行”,也是只有高度数字化场景中才有的测试环境。
例如在一条车水马龙的公路上,要验证一种交通调度算法的合理性,需要上千辆汽车的配合。但是在人类驾驶员的操控下,想要分毫不差地完美执行几乎是不可能的,但AI就能做到。
尽可能减小误差、保证已知条件的不变,在越发复杂的条件构成中,就显得愈加重要。也只有这样,才能更高效地试探出那条正确的前进方向。
而当沙盘推演结束,AI从中学到的东西自然就能更快地运用到更多行业中去,那里等着AI的不只有多变的环境,还有AI间的同门对决。
3. 叩响现实门扉的AI
如果只是套用从围棋这样信息全透明的简洁场景里学到的规则,那么留给AI施展的空间并不多。
因为在瞬息万变的现实里,信息的产生和变化是无不时刻都在进行中,就像在一个人潮涌动的街角,每个人下一分钟的具体位置都无法百分百确定。
特别是当越来越多领域的AI得到普及、“万物互联时代”到来后,AI之间更复杂的“多智能体协作/博弈”也会更为普遍。那么届时在这个方向上,它也会成为未来AI迈入其他领域,以及如何实现横跨多领域作业的重要课题。
在这一点上,强调多人合作的《王者荣耀》等游戏就正好有着用武之地。不仅游戏内AI指挥的多个英雄(智能体)间有着配合,双方的AI也可以一较高下。
在今年早些时候落下帷幕的第二届“腾讯开悟多智能体强化学习大赛”上,这场特殊电竞比赛里的双方选手就不用直接操控英雄,而是派出自己训练出的AI出战。最终来自清华大学的团队从23支战队中脱颖而出,拿下了最终的冠军。
比赛采用3v3长平攻防战模式
这场比赛的实现,基于一个名为“开悟”的AI开放研究平台。这个由腾讯AI Lab和王者荣耀团队共同牵头构建的平台,基于MOBA游戏复杂的环境,为训练决策智能AI 和研究多智能体博弈提供了一个比较理想的实验环境。
当然最重要的是,它为用户提供了用于读取《王者荣耀》对应测试场景和控制英雄行为的数据接口,能让其他研究者更便捷地测试自己的算法和模型。
这个平台为这些参赛者提供了《王者荣耀》的运算核心逻辑,以及计算平台、评估工具以及研究资源的综合支持等服务。这让参赛者们不需要做图像识别等技术要求更繁琐的处理,只需要关注具体的算法和多智能体之间的配合逻辑,才有了这样一场形式特殊的《王者荣耀》高校赛。
对于这些旁观者来说,或许目前这只是一场寓教于乐的AI实践课,但对于这些高校学子们来说,这也可能会是他们验证未来研究方向的重要契机。不少团队都在赛后反馈,在赛事中他们收获不少,还有团队在比赛结束后继续用开悟平台进行研究。
虽说现在这只是几个AI英雄间的互丢技能,但由此探索出的算法解决方案,或许是未来人工智能从数字场景走入现实各行各业的种子。
例如,股票AI如何量化计算每笔交易,在基于已有信息建立的模型下,还需要与其他股票AI的算法进行博弈;一场地震后分别负责不同救灾功能的AI机器人,不仅要考虑自己的挖掘效率,还要配合其他AI实时提供的数据,统筹计算出废墟的荷载能力避免次生灾害发生,这些都是未来可能出现的AI应用场景,
工业、金融或是交通,如果有成熟的AI应用其中,多个AI之间的配合和竞争都是可以想见的。不论是多个组装流水线上智能机器人的通力搭配,还是智慧交通系统里自动驾驶AI的安全和高效化,都有可能从这里起步。
就在两周前的11月21日,“开悟”平台还正式宣布扩大开放了“王者荣耀AI开放研究环境”的申请。这样就能有更多研究者,用上这个高度复杂MOBA训练环境,帮助加速强化学习领域内的交流,帮助AI走入现实。
不管是面向高校的“开悟大赛”,还是开悟平台的开放服务,他们对国内人工智能行业的积极影响是可以肯定的。AI既在游戏的虚拟环境中获得了养分,游戏也再一次证明了自己在娱乐功能外的不可替代。
我们越是读懂游戏和人工智能密不可分的纽带,就越想看到有一天它们之间的关系被淡忘。
因为那一天的到来,很可能就意味着AI已经完全走入了现实生活,与我们的方方面面都息息相关。而游戏终于也不用再一次次剖开自己证明,它在科技和社会发展中的重要意义,这个早已被玩家看清的事实。
文章转发自游戏研究社微信公众号,版权归其所有。文章内容不代表本站立场和任何投资暗示。