IBM 组织了一场人机辩论,人类与人工智能各胜一场

彭博社消息称,IBM 公司组织了一场顶尖辩手和人工智能之间的“人机辩论赛”,在场的记者、分析师和技术人员通过投票决定了胜负结果。

代表人类参赛的是以色列国际辩论协会主席 Dan Zafrir 和 2016 年以色列国家辩论冠军 Noa Ovadia,代表机器人参赛的是 IBM 最新开发的 AI 辩论系统 Project Debater。

本场比赛分上下两场,共两个话题。第一个话题是“政府是否应该增加太空探索的费用”,机器人为正方,人类为反方。第二个话题是“远程医疗是否会在医疗中占据更大的比例”,机器人依旧为正方,人类为反方。人机双方先后进行四分钟开场演讲,四分钟论辩和两分钟论证总结。

Noa Ovadia 参与了第一场辩论并赢得了比赛,Dan Zafrir 参与了第二场辩论但输给了机器人。到比赛结束时,人类与机器人各赢一场

现场观众反应称,Project Debater 能够完整地针对某个主题表达意见、提供充足的论据,甚至会主动开玩笑,来活跃气氛、丰富辩论内容。

在围绕“远程医疗”主题辩论时,机器人开场便说:“今天我们要讨论许多利害攸关的事情,它们对我来说尤其如此。”随后它又用惋惜的口吻说,“可惜我不能热血沸腾,因为我没有血液啊。”

Project Debater 的硬件外观看起来像一个等人高的黑匣子,正面是一块黑色的显示屏,上有三个律动的蓝色小点。辩论中,它会运用语音识别和语义分析技术来理解人类的发言,这一般需要耗费它几分钟的反应时间。准备好自己的发言内容后,机器人会以一个类似 Siri 的机器女声来说出自己的观点。

IBM 发言人称,机器人在比赛开始前并不知道辩论主题,所有发言均是临场发挥。Project Debater 的发言基于数以亿计的论文、报告和新闻报道数据,在分析这些数据后,Project Debater 可以就特定主题做出逻辑结构良好的演讲,并对对手观点进行反驳。

比如,在“太空探索”的主题上,Project Debater 既引用了 Wikipedia 上的资料,也引用了阿拉伯联合酋长国前总统 Sheikh 的一系列言论,还提到了德国经济事务部部长的报告。针对人类辩手“有很多其他事业更值得我们去花钱”的观点,Project Debater 反驳说,“这么说当然可以,但我没说太空探索是我们唯一要花钱的项目,不是除了探索太空我们就不做别的了。”

但是,因为缺乏对社会的“全面认知”,机器人在辩论中也提出了一些令人错愕的“大胆”观点。“激励我们的孩子去学习科学知识、从事数字工作,对于这个社会来说比建设更好的公路、更先进的学校和更完善的医疗更重要。”Project Debater 说。

另外,Project Debater 在引用资料时也以不自然的方式插入了随机引语,如使用了哥伦比亚广播公司新闻中常用的术语等。而且,作为一块黑色的面板,机器人也无法像人类辩手那样运用肢体语言、表情语言来加强情绪,所以在气势和感染力上显得偏弱。

现场观众认为,人类辩手的“舞台感”更好,但机器人的信息来源更丰富。虽然第一场比赛 Project Debater 落败,但第二场辩论结果显示,机器人以九票优势领先人类。有九名听众称,机器人改变了自己的原有看法,使他们站在了它的意见的一边。

IBM Research 首席调查员兼 Project Debater 创始人 Noam Slonim 称,IBM 对该 AI 系统的训练已有六年,直到两年前,它才有能力参与与人类的辩论。

Project Debater 被其描述为“IBM 对 AI 探索的下一个重要里程碑”,是“继深蓝(Deep Blue)和沃森(Watson)系统后的又一突破”。IBM 的深蓝程序 1997 年在国际象棋棋盘上曾击败世界冠军 Garry Kasparov。沃森系统在 2011 年的知识竞赛上曾击败世界冠军 Ken Jennings 和 Brad Rutter。

类似的人类精英不敌人工智能的案例还有很多。Google 的人工智能程序 AlphaGo 曾在围棋棋盘上挫败全球顶级选手。去年 1 月,一个名为 Libratus 的程序击败了全球四大顶级德州扑克玩家。

IBM 研究人员 Ranit Aharanov 认为,机器人此次在辩论舞台上的胜利远比之前在棋盘上的胜利更难得,因为“辩论是人类的文化,论证的内核往往是十分主观的。Project Debater 必须适应人的逻辑习惯,并提出人们可以理解和接受的论点。”

“在辩论中,人工智能必须学会在凌乱的人类文明中进行导航和检索,而不是像在棋盘游戏中那样使用预定好了的规则。”Ranit Aharanov 说,而且决定胜负的是手握投票权的人类,要想打动他们是很难的。

根据 IBM 的计划,Project Debater 未来也许可以帮助企业收集、整理和加工特定主题的信息,亦可为政府在施政方面提供建议,还可为他们获得更全面的民意反馈调查等等。此前,IBM 已将沃森系统已经投入商用,但并没有公开其收入情况。

IBM 发言人称,Project Debater 的目标是成为“一个没有偏见的机器”,以帮助企业和政府透过生活中的复杂的表象提取出一些本质的东西,并产生较为公正的结论。但是,因为它所基于的数据大多数仍然是人类的作品,所以它到底能在多大程度上剔除偏见仍然有待考量。

题图 / IBM

我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。