英语没过四级,也能和全球玩家开黑

闭门造车也能独自开心的单机游戏时代已经被远远甩在身后,如今只要是个游戏就有天梯有竞技场,团队合作成了也成了游戏的必备要素。然而,新的互联网带来了新的烦恼——很多时候,阻止你胜利的不仅是咸鱼一样的游戏技术,还可能是令人着急的英语水平。

眼看着主播们在游戏里呼风唤雨,甚至因为打游戏而喜获一段跨国情缘,而自己却在说完“I’m fine thank you and you?”之后就和队友面面相觑,只好一边感念书到用时方恨少,一边回归熟悉的国服。

祖安永远欢迎你
祖安永远欢迎你

为了帮助大家走出国门走向世界,和国际友人自由开黑,专注于 PaaS 云服务的大数据公司 LiveData(云上曲率)打破了游戏局内的语言壁垒,利用 Google 发布的机器学习开源框架 TensorFlow 实现了游戏内 23 种语言间的互译。

游戏局内实时翻译

搭载了 LiveData 智能实时翻译(ALT)系统后,来自世界各地的游戏玩家可以自己的母语自由发言,而这些发言都会被自动翻译成用户设备所使用的语言——不管你说的是俄语还是英语,

当语言壁垒被打破,有趣的画面就出现了。

在使用了 ALT 的策略游戏《阿瓦隆之王》全球服里,你能和来自世界各地的玩家一起互相帮助、开展贸易、发动战争。强大的聊天即时翻译功能让聊天成了游戏的重要构成部分,无论是唐诗宋词、还是老铁扎心,全部都能妥妥的翻译。

对战全靠翻译器,再也不怕老外队友会错意,打游戏永远都有主场的味道。

在强大的 ALT 助力下,土生土长的国产游戏《阿瓦隆之王》没有被语言关绊住手脚,而是在国外攻城略地,一举在 13 个国家拿下 AppStore 排名第一。

除了日常聊天,ALT 还在训练时引入了游戏领域语料库,针对口语化、缩略语及非规范聊天文本进行了深度优化,对游戏语言的理解能力堪比多年老玩家。

无论是“Please w8(请等一等)”还是“GG(干得好)”,玩家大可在游戏中延续自己的缩写习惯,甚至偶尔出现拼写错误也不影响模型对语义的理解。

部分 ALT 缩略语示例
部分 ALT 缩略语示例

与市面上其他翻译产品相比,ALT 模型在游戏领域的表现在权威机器翻译测试 NIST(美国国家标准技术研究所测试) 和 BLEU(双语评估测试)中都获得了更高的分数,已经逼近人工译员表现。用了 ALT,就像和英语专八选手一起打游戏。

在特定语料库上,ALT 得分比 Google 和 Microsoft 更高
在特定语料库上,ALT 得分比 Google 和 Microsoft 更高

ALT 的良好表现,和 ALT 背后强大的 TensorFlow 是分不开的。

ALT 使用了号称“变形金刚”的 Tensor2Tensor(T2T)深度学习系统,该系统利用 Attention 方法来建模序列到序列(Sequence-to-Sequence,Seq2Seq)的问题,在图像分类、语言模型、情感分析、语音识别、文本摘要、机器翻译等领域都有很好的应用效果。

比如,当一个英文句子进入 ALT 时,会进入编码器,被神经网络编码成一个能够映射出句子大致内容的固定长度的向量,接着,解码器会将向量再还原成对应的序列数据,由一种语言的序列映射到另一个语言的序列。

T2T 中的英译汉过程示意图
T2T 中的英译汉过程示意图

而在具体训练模型的过程中,每个翻译方向的训练语料都有数千万平行句对,相当耗时耗力,但使用了 TensorFlow T2T 模型之后,训练和迭代过程变得更迅速,每个翻译方向的翻译模型在单卡 V100GPU 下不到 24 小时就能完成训练迭代,翻译结果也更加准确了。

玩家到底在想什么?

对于玩家来说,在游戏里自由发言非常重要,而对于游戏策划和运营而言,玩家的发言也是重要的信息来源:新版本是否受欢迎?玩家对游戏的评价是正面还是负面?有哪些地方需要改进?

在搭建 ALT 辅助翻译的同时,LiveData 也利用 TensorFlow 建立了 LSTM(long-short term memory)循环神经网络分析游戏舆情:

分析玩家在游戏内的发言内容(通过算法剔除与游戏不相关的寒暄闲聊部分),并通过机器学习算法将玩家的聊天内容按照话题进行分类,可以看出玩家是否喜欢当前的游戏版本;

利用自然语言处理技术,有重点的分析游戏新版本/新玩法/新道具等特定内容的玩家反馈,可以为下一版本的迭代提供依据;

归纳总结游戏中出现的问题类词语(如bug、crash等),实时监控其频率及趋势,可以及时得到突发问题的预警,快速决策……

利用游戏舆情分析功能,游戏策划和运营能更直接地了解用户的真实想法,进而优化产品。

目前,游戏舆情数据的来源主要有以下几种:

  • 游戏聊天数据:游戏中不同频道的聊天数据,包括群组聊天、房间聊天、私信聊天等;
  • 应用商店评论数据:涵盖但不限于苹果 App Store、腾讯应用宝、Google Play 商店、手机厂商自带的应用商店等;
  • 玩家论坛数据:游戏的官方论坛、玩家们自建论坛等渠道;
  • 社交软件聊天数据:通过导入游戏官方 QQ 群、微信群、Facebook 等社交平台的聊天数据。

在获取聊天记录数据后,基于 TensorFlow 建立的机器学习、自然语言和情感分析的协同处理可以提取玩家反馈中的关键信息,准确率可以达到 95% 以上。

和已经存在的翻译模型相比,LiveData 利用 TensorFlow 训练出的“深度定制”翻译模型更适合玩家使用,同时,TensorFlow 开源的机器学习模型也让小游戏厂家能轻松利用玩家大数据,做出更优秀的新版本。

用了 TensorFlow,哪怕英语没过四级,也能走向全球。

目前,我们仍在征集更多杰出的TensorFlow应用案例,你可以扫描海报下方二维码或点击“阅读原文”提交案例参与我们的报道!

或者你对这个项目感兴趣,想要了解更多关于项目的报道,也可以扫描下方二维码或搜索微信号:pingwest-live  添加品玩助手一起聊聊!