你遇到过最好的游戏AI体验是什么?你认为AI未来能够如何进一步提升游戏体验?

你遇到过最好的游戏AI体验是什么?你认为AI未来能够如何进一步提升游戏体验?我们邀请到“网易互娱AI Lab”的同事们来回答一下这个问题~

在回答这个问题之前,不如先来看下2019年游戏产业的发展情况。

2019年,中国游戏产业同比增长7.7%,虽有小幅回升,但相比过去动辄约30%的增幅,近两年游戏市场增速表现出极大放缓。

在行业增速显著放缓背后,是难以被满足的玩家需求。据伽马数据研究发现,游戏感受、玩法创新和社交是大多玩家最注重的游戏体验,但这三个需求仍未得到完全满足。

游戏行业告别高速迸发期,玩家对品质的要求逐渐增高。在这种情况下,游戏产品的升级就变得越来越重要,而这关键在于创新与技术。比如在《全境封锁》中,通过AI技术,不同派系的NPC仿佛被赋予了不同的个性,胆小的NPC遇到玩家攻击会藏起来,胆大的则会回击。这些看似细微的游戏设计,其实能给玩家带来不一样的游戏体验。

不止是NPC更加聪明,近年来随着人工智能技术和大数据发展的突飞猛进,AI未来或许还能为游戏产业注入更多新的活力。

首先,从游戏制作者的角度而言,AI在减少开发时间与成本的同时,能够让游戏变得更加精致。例如,通过各种形式的生成-对抗网络模型,AI能直接生成高质量的角色原画、场景原画,甚至三维动作资源……这不仅帮助美术同学减少了很多简单却繁琐的工作,也能在不增加成本的情况下改善游戏画面,增加游戏沉浸感。此外,AI还能进行游戏测试和调整,替代人类完成这类耗时耗力的重复性工作,让开发者能够把精力放在游戏研发等更具价值的内容上。

其次,从玩家角度而言,AI能够带给玩家更极致的游戏体验。除了上文提到的能够赋予NPC智慧、让竞技玩法更具趣味性以外,AI还能帮助打造一个更具平衡性、公平有序的游戏环境,如基于多种维度进行匹配或反外挂等功能。

那么,游戏AI未来究竟将如何进一步提升游戏体验?今天,我们特意邀请了来自网易互娱AI Lab的四位技术专家,请他们来谈一谈自己对游戏AI的更多见解。

随着人工智能技术,尤其是强化学习技术的不断发展,游戏AI开始称霸各类型的游戏:AlphaZero零封围棋世界冠军柯洁,“AlphaStar”在星际争霸中击败99.8%的玩家 ,Dota2 AI “OpenAI Five”在电竞游戏中击败世界冠军,以及Pluribus在六人无限制德州扑克中击败人类职业选手……

然而,实际我们在游戏中引入AI时,并非是为了让机器完败人类,而是为了提供旗鼓相当的对战体验,让玩家享受到竞技的趣味性。下面将从战斗机器人、测试机器人和游戏匹配几方面来解释游戏AI是如何帮助确保游戏平衡性的。

  • 战斗机器人

小怪、BOSS、NPC等由电脑控制的游戏机器人不仅是游戏中的必备角色,有时甚至可以成为游戏的一大卖点。如日本游戏厂商 From Software 开发的《魂》系列和《只狼:影逝二度》,其高难度的关卡战斗设计曾引起玩家的广泛讨论,并激起了很多游戏高手的挑战欲望。而在PVP游戏中,自动化的战斗机器人也有多种用途,如空闲时段的排位补位机器人,给连败玩家送福利的温暖局机器人,以及新手指引、进阶练习中的陪练机器人等。

然而,实现一个机智有趣的游戏机器人并非易事。简单地通过调整游戏角色的数值来调节AI强度并不适用于所有的游戏,过难或过易都会引起玩家的反感,大大降低游戏的乐趣。我们真正需要的是一个智能灵活、难度适中的游戏AI。这意味着开发者需要针对游戏中可能发生的不同情况,设计合理的AI行为逻辑,并通过角色的控制接口展现具体的游戏内行为。

传统上,业界在开发游戏NPC或Bot时采用的是规则驱动的方式(如状态机、行为树,或GOAP\HTN等更复杂的效用系统),人为定义的条件会触发预先设计好的游戏行为,条件越多,行为越复杂,角色看起来就更智能。规则驱动的局限性也很明显,主要体现在两个方面:一是规则很难涵盖所有的情况,设计出来的机器人表现就会比较僵硬;二是需要大量的人力去设计实现复杂的AI行为逻辑。

以强化学习为代表的人工智能技术则恰好能够突破以上两个限制。我们可以构造出一个以游戏状态为输入,角色控制动作为输出的神经网络模型,通过训练的方式摆脱对人工设计的依赖,同时获得一个更加聪明的机器人。

强化学习是一类不依靠数据,在与特定环境的交互中不断试错,发掘最优策略来解决给定任务的人工智能方法。与图像种类预测、机器翻译等深度学习任务不同,强化学习模型并不需要提前准备好的数据。模型会作为一个角色参与到游戏中,针对游戏中可能发生的各种情况(State),尝试不同的动作(Action),并根据游戏的反馈(Reward)调整行动策略,直到模型可以完美地完成设定的任务。得益于神经网络强大的泛化能力,强化学习模型除了能够用于研发Bot和NPC以外,甚至能够处理像星际争霸这种每帧理论可选操作多达10^26的复杂游戏。

另外,对比下图游戏AI的开发流程,我们可以看出,通过强化学习,游戏AI设计实现的人力成本,变成了设计模型的人力成本和训练模型的机器成本。因此,当期望得到的游戏AI足够复杂时,强化学习方法将更具成本优势。

  • 测试机器人

保证游戏战斗系统的平衡性一直是游戏开发的难点之一。比如,在MOBA游戏中新加入一个英雄后,游戏策划既要保证这个角色自身的技能和数值设计符合预期,又要确保该角色与其他英雄配合时不会存在无解的套路,不然同样会影响竞技的公平性。而这个过程通常需要大量人力去反复进行游戏测试和设计调整。

上文提到,强化学习能够通过在环境中不断试错得到一个强大的游戏AI。而基于这种“不断试错”的特性,我们可以将强化学习模型转变成为一个强有力的自动化游戏测试工具

具体来说,首先我们可以训练得到一个近似高端玩家水平的游戏AI,再通过与其他现有角色的AI进行模拟战斗,就可以在角色上线之前模拟真实的对局数据,并以此来调整角色的设计,评估角色加入后对游戏平衡性的影响。同时,如果游戏环境中存在的漏洞,模型也非常有可能在海量的探索尝试中发现并加以利用,间接地帮助我们挖掘出隐藏很深或是极端操作下才会触发的游戏bug。

此外,对于一些相对简单的游戏环节,比如MMORPG游戏中的一个小副本任务,利用搜索算法或者适量的人类玩家数据进行监督学习,还能够快速生成测试跑图机器人

  • 战力评估与智能匹配

相信很多玩家都有过被队友坑,或被对手完虐的体验。通过AI的匹配机制,我们可以准确评估玩家水平、匹配水平相当的队友以及对手,保证对战的公平性,改善玩家的游戏体验。

相比传统ELO等方法,Trueskill2可以综合先验信息(如装备购买情况、游戏经验值等)和后验信息(如局内击杀数、被击杀数、断线逃跑情况等),通过概率图模型让消息在整个模型中传播,不断修正对玩家水平的评估,在几个对局内就获得对玩家水平的准确估计。

而在水平匹配的基础上,玩家可能对社交也有相应需求。我们可以通过AI算法分析玩家用户画像,再进行相应匹配,就能够满足玩家更高层面的追求。

一款优秀的游戏除了需要具备新颖的玩法以外,往往也离不开富有表现力的画面效果。

在《刺客信条:起源》中,除了细致的人文风貌刻画外,每一个形象鲜活自然的NPC也进一步增强了游戏的代入感。例如下图里的游戏角色动画,他的口型与语音完美匹配,神态动作也非常生动自然。

精美的画面已成为各类游戏表现力的保证。随着各大厂商对游戏美术越来越重视,其针对美术投入的成本也不断飙升。而AI的一系列技术,能够帮助减少动画制作的成本和时间,让更精美的游戏画面成为可能,从视觉层面提升玩家的游戏体验。譬如,NPC的面部动画生成和动作控制技术。

  • AI语音驱动角色面部动画技术

谈到角色面部动画,大众更为熟悉的技术是面部动捕,传统的面部动捕技术需要配备专业动捕设备和演员进行拍摄,还会产生高昂的费用。但实际上,除了面部动捕技术以外,还有一种成本更低、适用场景更多的AI黑科技——语音驱动角色面部动画技术。

首先,我们需要建立一个足够量的语音和对应的面部表情动作序列数据,基于这些数据训练出一个端到端的深度神经网络模型。不论是从语音到表情和口型标签,还是从语音直接到三维角色的面部表情控制器,该模型都可以取得相当不错的泛化能力,基本可以做到一个模型就能处理不同性别、年龄、语言的语音数据。

管纯基于语音的面部动画在精度和效果上距离面部动捕还有一些距离,但受限于成本,以本世代3A游戏的体量,不可能每个NPC都有动捕的待遇。利用该技术,一方面,可以用极低的成本让游戏里的所有人物都具有一定的表情动画;另一方面,在国际化背景下,很多游戏是拥有多语种配音的,目前还没有游戏工作室会奢侈到为一种语言的配音单独动捕一套口型动画,利用该技术可以快速生成跟不同语言发音匹配的口型动画,也可以为玩家提供更本地化的体验。

  • 角色动作控制技术

角色动作和状态的切换流畅度也是影响画面表现力的重要因素之一。传统的、基于状态机的角色动画控制系统中,开发一套体验完美的动作器,实现平滑自然的动作生成,其复杂程度其实超乎玩家想象。在一些动作型3A游戏中,一个主角的动画状态机轻易就可以包含几千个动作节点,这些节点之间的跳转和过渡规则完全依赖游戏开发人员的经验手工指定,其开发和维护的复杂度可想而知。

正是在这一痛点驱动下,育碧提出了Motion Matching技术,该技术将研发人员从复杂的动作过渡规则中解放出来,只需要关注目标动作本身。给定一个目标动作和一个动捕动作库,Motion Matching会根据角色的当前姿态、运动速度、运动方向等信息、自动从动捕动作库中优化出一个能从当前姿态自然过渡到目标动作的动作序列。

从事算法工作同学可能会对上述流程感到熟悉。是的,如果抛开三维骨骼动画底层的技术原理,角色动画其实就是一组描述每个骨骼点平移和旋转信息的序列数据。上述动作过渡问题,其实就是针对序列数据的插值或补全问题,这也是AI技术最擅长处理的领域之一。

我们可以利用AI技术、设计一个针对骨骼动画数据的特殊网络结构,并利用大量动捕数据对该模型进行训练,从而赋予该模型从角色的当前状态、环境信息、历史状态、用户控制信号等信息、自动预测下一帧动作的能力。虽然目前该技术在游戏中落地还面临不少工程上的困难,但是相比于Motion Matching技术,AI技术无疑赋予了角色动画控制更多的想象力。凭借深度神经网络强大的泛化能力,AI模型可以从海量数据中抽象、总结出关于动作的深层次逻辑,从而实现更自然地动作切换和过渡、以及跟所处环境更好的适配。

外挂、辱骂等恶意行为破坏玩家正常的游戏体验,向来为大家所深恶痛绝。AI可以通过图像识别或基于用户画像分析来打击游戏外挂,也能够基于语音语言识别技术来过滤脏话等敏感信息,让游戏环境更加公平公正、清洁有序。

  • 外挂打击

游戏外挂五花八门、层出不穷,比如竞技类游戏的全图作弊器、数值修改器等外挂,RPG游戏存在的自动挂机、自动刷野等外挂。传统应对方案就是在客户端打各种安全补丁,但道高一尺魔高一丈,外挂插件也会随之迭代,令各大游戏厂商苦不堪言。

比如吃鸡游戏的透视挂, 无论玩家躲在房间里还是掩体背后, 都会被开挂者一览无余。本质上,开挂者是对客户端进行了非法修改,使游戏画面展现了本不该被获知的信息。而AI能够定期或在满足特定条件时(如某位玩家在无视野情况下将对手枪枪爆头),对游戏画面进行检测,从而让外挂行为无处遁形。

利用AI进行图像识别打击外挂,其基本的原理结构是卷积神经网络(Convolutional Neural Networks, CNN)。CNN通常是一个多层的网络,能够通过卷积(convolution)这种数学操作来“观察”图像中的各个区域。而每块区域的计算输出会经过非线性的激活函数,并在更高层进行汇总,直到在最高层得到目标输出。针对反外挂,CNN的输出可以是一个二元判断,即游戏图像是否有外挂嫌疑。只要在训练时给AI看过足够多的外挂图片,AI就能记住这类图片的特点,并对于外挂进行无死角监控。

类似地,AI还可以对于玩家上传的图片如头像进行违规审核,阻止其中的色情暴力内容。未成年人防沉迷用的人脸识别同样是基于类似的原理,只需要将输入从一张图片变成两张图片,保证用户实时验证的人脸和注册人脸为同一个人即可。

  • 聊天内容过滤审核

游戏聊天公屏界面里不受控制的言论会带来很多潜在的风险,辱骂、色情、政治、暴力、广告破坏了游戏环境,影响玩家正常交流,困扰着很多游戏工作室。传统解决方案为采用关键字过滤,但是玩家的表达方式在不停演化。简单的关键字识别很容易利用字符填充、谐音、俚语等方法绕过。对于有利可图打广告的灰色产业工作室,更是新说法层出不穷。

在这种情况下,我们就可以借助AI模型强大的泛化能力来识别敏感信息,例如基于TextCNN和Transformer的分类器。TextCNN是卷积神经网络在文本分类上的应用,其结构简单、性能快,适用于聊天内容短,非法特征明显、信息集中的情景。

Transformer则是google在2017年提出的网络结构,相较于TextCNN它的结构更加复杂也更加灵活。Transformer的self-attention结构根据上下文内容的关联程度自动调节每个字的权重,使得特征信息得以凸显。Multi-head Attention将字向量分成多段,每一段分别与不同的Attention矩阵计算,允许模型捕捉更多样的语境信息。

游戏内的图文信息体量巨大且繁杂,传统方式或许难以有效识别和过滤敏感内容,但深度学习凭借极强的学习能力,能够从容做出应对,创造一个更有秩序的游戏世界。

最后,来介绍一下我们网易互娱AI Lab:网易互娱AI Lab成立于2017年,隶属于网易互动娱乐事业群,是游戏行业领先的人工智能实验室。实验室致力于计算机视觉、语音和自然语言处理,以及强化学习等技术在游戏场景下的的研究,应用和落地,旨在通过AI技术助力互娱旗下热门游戏及产品的技术升级,目前技术已应用于网易互娱旗下多款热门游戏,如《梦幻西游》、《一梦江湖》和《第五人格》。

参考

[1]https://docs.unrealengine.com/Images/Engine/ArtificialIntelligence/BehaviorTrees/BehaviorTreesOverview/BT_Overview_Intro.png

[2] Karras, Tero, Timo Aila, Samuli Laine, Antti Herva and Jaakko Lehtinen。“Audio-driven facial animation by joint end-to-end learning of pose and emotion.” ACM Trans。Graph。36 (2017): 94:1-94:12.

[3] Holden, Daniel, Taku Komura and Jun Saito。“Phase-functioned neural networks for character control.” ACM Trans。Graph。36 (2017): 42:1-42:13.

[4] http://www.hxnews.com/news/dmyx/djyx/yxxw/201802/26/1464748.shtml

[5] CNN Architectures

http://cs231n.stanford.edu/slides/2020/lecture_9.pdf

[6] Y. Kim, Convolutional Neural Networks for Sentence Classification, in: Proc. 2014 Conf. Empir. Methods Nat. Lang. Process., Association for Computational Linguistics, Stroudsburg, PA, USA, 2014: pp. 1746 1751. doi:10.3115/v1/D14-1181.

[7] Vaswani A , Shazeer N , Parmar N , et al. Attention Is All You Need[J]. 2017.

大家有任何想法都可以在评论里提出~欢迎一起交流~

来源:知乎 www.zhihu.com

作者:网易游戏学院

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 16 个回答,查看全部。
延伸阅读:
AI思考速度最慢的游戏是什么?

有没有玩家决定策略之后让AI按照策略自行作战的游戏?