换脸之后的“换骨架“技术来了,可以让你假装会跳舞

在《碟中谍 5》中,基于骨骼动作的步态检测被认为是级别最高的安检手段,就连汤姆克鲁斯也只能用间接手段来通过。而现在,新的人工智能技术似乎能帮到他。

加州大学伯克利分校的研究人员最近开发了一种深度学习系统,可以识别人体的虚拟骨骼来映射姿势。最终能让视频里的你跳出此前从未学习过的舞蹈动作。

简单来说,这套深度学习算法会先分析大量的专业舞蹈视频,通过算法为其中的舞者创建一个虚拟的骨架来记录跳舞时候身体的姿势。随后再采集普通人大约 20 组不同姿势,角度的动作和面部信息。

通过虚拟骨架将两者相互对齐后,一个完整的舞蹈视频就可以生成。甚至为了逼真,在虚拟身体转动的时候,算法还会随着角度的不同来生成面部表情。

当然效果并不能算尽善尽美。从生成的视频来看,跳舞者偶尔会出现身体抖动,细节上也很模糊,譬如手指几乎没办法看清,甚至在跳芭蕾舞的时候,脚尖也几乎消失。但在制作那些刻意强调身体动作的舞蹈,例如机械舞的时候,效果就正常一些。

这项技术是起源于伯克利大学关于“人工智能的实际应用”主题研究,论文的题目是“Everybody Dance Now”。研究人员表示,这项技术可以让未经任何训练的业余舞蹈者像专业演员一样旋转、舞动。进一步,他们希望能将这项技术用在电影的特殊武术动作上。

虽然,新技术未来的用途很清楚,但随之而来也有一些潜在的道德问题。此前,同样是通过深度学习来将视频中演员的面部替换成其他人,名为 Deepfake 的深度学习技术很快就在色情视频中被滥用,甚至出现某些人用来制作网络暴力视频进行传播。

当时,Reddit 迅速关闭了传播该类视频的板块,就连互联网最大的色情视频网站 Pornhub 也公开表示:拒绝 Deepfake 类型的视频上传,理由是 AI 制作出来的视频多半可能没有得到肖像所有人的许可。

对于新技术而言,此前已经有过类似的恶搞视频,流传最广泛的莫过于恶搞奥马巴滑着滑板出席发布会,或者一路后空翻来到演讲台前,不过这些视频都是较为专业的制作者制作,数量也比较少。一旦 Everybody Dance Now 这种新技术普及,制作的门槛会降低很多。

正如不再确定视频中说话的脸是真实的一样,未来可能无法保证一个人的身体动作是真实的了。不过,技术带来的问题也正在被技术所尝试解决,GIF 动图托管公司 Gfycat 就在 2017 年对外表示,已经找到了一种方法,可以训练人工智能来识别假视频。

Gfycat 的人工智能方法利用了已经开发的两种工具,都是用猫科动物命名的:Angora 项目和 Maru 项目。当用户上传一张低质量的 GIF 动图时,比如是关于泰勒·斯威夫特(Taylor Swift )的虚假内容到 Gfycat,Angora 项目可以在网页上搜索分辨率更高的 GIF 来替代它,通常这种 GIF 是原始真实的。

Maru 项目则是来识别视频中每一帧的面部和背景画面,由于 AI 技术生成的视频总会有不完美匹配的细节,这就是提高了是虚假视频的可能性。如果 Gfycat 怀疑一个视频被修改为了别人的脸,人工智能会开始搜索,尝试找到原来的视频。如果新的 GIF 图片和源文件不匹配,人工智能就可以断定视频已经被修改了。

每天有数百万的视频被上传到互联网上,YouTube 上每分钟大约有 300 分钟的视频发布。虚假视频和相应的检测注定是一场漫长的持久战。

题图来源:Giphy

我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。