Google 年度开发者大会,它想说的全都是人工智能

当地时间 5 月 8 日早上,Google 在其山景城总部附近的 Shoreline 露天剧场举行 I/O 2018 开发者大会。

首日大会主题演讲由 Google CEO 桑达尔·皮蔡例行主持,演讲内容围绕 Android 平台进行,宣布了新版 Android P 首个测试版,并更新相册、新闻、地图、语音助手在内的多项功能。

今年 Google I/O 没有发布重量级硬件产品,只带来由 JBL、联想、LG 等制造的带屏幕的智能音箱,会在 6 月上市。

演讲接近尾声时,Alphabet 旗下自动驾驶汽车部门 Waymo 也第一次在 I/O 主演讲亮相。

所有这些宣布的新产品、新功能仍围绕一个主线:人工智能。

Google 语音助手更像人了,声音像,回答的方式也像

皮蔡用几个技术升级来进行功能更新的铺垫。他展示了一段新闻评论节目,两个主持人正在激烈争吵,不停互相打断对方说话。升级后的 Google 人工智能可以分析两个人的语言,可以单独为两个人生成字幕,不受对方打断的干扰。

再举了人工智能帮助诊断发展中国家的糖尿病视网膜病变的例子后,皮蔡开始详细介绍人工智能语音助手 Google Assistant 的功能升级。

首先 Google Assistant 将提供 6 种全新的语音。这些语音全部由 Google 去年宣布的 WaveNet 技术合成,合成的方式不是一字一句,而是计算说话原始的声波模型,从而实现更好的拟真效果。这 6 种语音中有一种是由 R&B 歌手 John Legend 帮助训练,Legend 本人在 Google 录制了一系列单词和整句,最终模拟的语音效果和他本人听起来相当类似。

功能上,Google Assistant 最大的变化是引入了“自然对话”升级。它可以连续识别上下文中不停切换的主体,以及一个句子中的多个提问。

举例来说,过去和 Google Assistant 对话,必须一个句子布置一件事情,同时每一句都必须包含完整的信息,简单的说就是语音助手是以一句话为单位进行识别的。

现在用户则可以像对一个真人那样说话,比如前一句是问某个球队的比赛成绩,下一句设定去哪儿接人的待办事项,然后可以以“那球队接下来的比赛日程”或类似的话继续刚才的对话。

同时,“多任务对话”更新的重点围绕句子中的“and”词汇,可以直接在一句话中布置多个任务,比如“明天天气如何然后给我叫个外卖”,Google Assistant 可以直接执行两个任务。

在最令人印象深刻的技术展示中,Google Assistant 的对话能力非常强大:它可以在你忙的时候直接和提供服务的店家打电话预订服务,比如理发店和饭馆。

在演示中,理发店店员说的很简短,比如需要什么服务?几点?哪天?什么时候,Google Assistant 也可以像真人那样回复“就今天 10 点,我要剪头发”;在预定餐馆的演示中,餐馆的接线员明显有安排故意刁难 Google Assistant,反复说“今天不能预定,但星期三你可以直接过来,你到底要定哪天?几个人?”之类的话,Google Assistant 有一点点停顿,但准确读懂了意思。

 “对于技术的期望因人而异,取决于你在世界的哪个地方,”皮蔡说,“对于像我这样在没有电话的世界中长大的人,清楚地记得科技如何改变生活。 这就是为什么我们致力于将数字技术引入全球社区。”

Google 同时宣布了基于 Google Assistant 新的硬件,带屏幕的智能音箱。这种新硬件看起来和电子相册类似,带有音箱和屏幕。除了支持 Google Assistant 的基础功能以外,这种新硬件可以通过屏幕观看 YouTube Live 节目,查看家用安全摄像头的画面,或者语音搜索带有步骤指南的菜谱。

由 JBL、联想、LG 等制造的智能屏幕音箱会在 6 月上市,Google Assistant 的新功能会在接下来几个星期实装。

下一版 Android 带有系统级人工智能,也关注你的“网瘾”

新版 Android P 在 Google I/O 上宣布了具体的变化,主要有智能、易用性和数字健康三个大方向。

首先还是贯穿整个演讲的人工智能。Android P 中的人工智能用在多个方面,比如省电。手机知道你用哪个应用频次更高,从而决定在什么时刻将某些应用彻底关掉。Google 说,这个叫“自适应电池”的功能可以减少 30% 的 CPU 活动时间。同时,“自适应亮度”的功能也可以分析你的使用习惯,在你不常使用手机的时段减少点亮屏幕的次数和亮度,达到省电的效果。

Android P 中,人工智能将成为系统级的功能,来预测你接下来要干嘛。举例来说,当你在搜索框中键入“无限”几个字时,会出现《复仇者联盟:无限战争》的热度搜索选项,同时在搜索结果的最下方,会出现购买电影票的快捷操作按钮;当你键入 Lyft,准备打开打车应用时,在搜索框的最下方将直接出现“打车回家”的快捷操作,点击之后将自动设定上车和下车地点。

易用性的更新主要体现在界面变化上。一方面,Google 的全局搜索框被下调至屏幕最下方,主屏幕按钮的上方位置。同时三个主屏幕按钮被精简至一个,大操作都变成了手势模式。比如在主屏幕按钮上侧滑是多任务快速切换,上滑就是打开传统的多任务界面。这个新的多任务按钮看起来和 iPhone X 的手势操作有点类似。

还有一项主要更新是“数字健康”。

这个叫 Digital Wellbeing 的更新简单的说就是防沉迷模式。首先系统中会整合一个统计工具,可以统计每日使用手机的时间、那些应用用得多,哪些时段用得多;同时,可以给这些用得多的应用设定使用限制,比如可以给视频应用设定一个工作时间不能打开的限制,当你上班摸鱼的时候,点击视频应用图标,系统会用一个变灰的图标和一句提示,让你不要再用了。

另一个叫 Wind Down 的功能则关心你能不能按时睡觉。当你躺下准备入睡时,可以设定入睡时间,在入睡时间过后,你的手机不仅进入防打扰模式什么通知都收不到,同时画面也会变成黑白显示,督促你赶紧去睡觉。同时这项功能也被整合进了自动防打扰功能中,只要把手机扣在桌上就会自动启动。

Android P 的公开测试今天起启动,Google Pixel 系列、Essential PH-1、Sony Xperia XZ2、小米 MIX 2S、Nokia 7 Plus、Oppo R15 Pro、Vivo X21 等 11 款手机可以在官方支持下直接装进测试版系统先行尝试。

Waymo 智能车亮相 I/O,但只是露个面

让人有些惊讶的是,Waymo 也出现在今年 Google I/O 主题演讲中。因为在 2016 年 12 月的组织架构调整中,Waymo 被拆并入 Google 母公司 Alphabet,不再是 Google 子公司。

上台演讲的是 Waymo CEO John Krafcik 和 CTO Dmitri Dolgov,这是他们第一次来 Google I.O。他们花了点时间解释人工智能在自动驾驶研发中的作用,并声称人工智能对于训练车辆在不同路况和交通状况下做出正确决定都显得至关重要。

“我们不只是建造一辆更好的汽车,”John Krafcik 在台上说,“我们正在构建一个更好的司机。”

John Krafcik 正在介绍 Waymo 的公开道路上测试成果。图/qz 

据 Waymo 介绍,由于运用了深度学习,它们将行人检测准确率提高了 100 倍。在今年 3 月 Uber 自动驾驶车撞死行人的事件中,事发车辆把行人误认为塑料袋,因此径直撞上去而不是紧急制动。

“我们的汽车需要了解每个物体与其他物体的相互作用,并以安全和可预测的方式行事,” Dolgov 说。在他的演示中,Waymo 成功地预测了一个行人闯红灯然后事先把车速降下来。

每个交通场景中的个体行为都存在差异化,他们不像车道线、路牌、隔离栏那样有显著的共性特征。Waymo 现在让机器建立起对人类行为的理解,这的确是一个人工智能可以真正起到帮助作用的地方。它们还试图利用人工智能解决下雪天气的雷达识别精度差、准确率低的问题。

目前 Waymo 已经在公共道路上行驶约 1000 万公里,并完成超过 90 亿公里的模拟测试。

Waymo 的下一个重大举措将是在今年晚些时候在亚利桑那州凤凰城上线 Waymo 自动驾驶叫车业务,具体细节暂不知晓。几个月前,Waymo 透露它正在为 Google 亚特兰大数据中心试驾自动驾驶货运卡车,同时它还宣布与捷豹建立一个全电动自驾车车队。

地图、邮箱、新闻、相册,所有应用级更新都与人工智能有关

Gmail 宣布 Smart Compose 功能,通过理解邮件的上下文,为用户提供备选的语句。这是 Gmail 智能回复功能的延续,将在未来几周内向用户开放。届时使用的前提是启用新版 Gmail。

Smart Compose 通过理解邮件的上下文,为用户提供备选的语句。

Smart Compose 在后台运行,用户输入如“有段时间没见你了”,它会给出“希望你过得好”的建议,用户点选以后,文本便会自动填充。Google 希望这能提高写邮件的效率并减少语法或者拼写错误的可能。目前不知道是否支持中文使用环境。

Google 相册可以对黑白照片着色。每天浏览量达到 50 亿次的 Google 相册正变得越来越聪明,可以自动对以前的黑白照片进行着色。

Google 相册给黑白相片着色。图/Ars

它还会自动识别照片的曝光度并适度提亮,并自动识别照片中哪些人在用户的通讯录中,然后提示用户是否要将照片分享给他们。所有这些新功能将在未来数月内集成到 Google 相册中。对于开发者,Google 也发布了新的 API,允许他们把 Google 相册服务集成到各自的应用中。

Google Lens 不但可以识别图片文字,还能在照片中选中文字。新的 Google Lens beta 版将内置在 Google Pixel 2、LG 7 ThinQ、小米、HMD 品牌等 10 款设备的原生相机软件中。图像识别功能可以提供照片中图书、建筑物和艺术品的更多介绍。

可以直接选中、复制图片中文字的 Google Lens。图/Ars

工作原理就是拍照片、机器学习识别图中文字像素以获得更多细节。如果拍的是商品,Google Lens 还会偶尔提供购物链接。对于识别纯文本照片,Google Lens 可以直接在图片上选取、复制文字,这与 Google Translate Image 的功能类似。

Google News 大改版。 “我认为今天产生的新闻报道比以往任何时候都多,“皮蔡说,“在有需要的时候,人们会转向 Google,我们有责任提供这些信息。”

Google 介绍它们使用强化学习,了解用户的阅读习惯,尽量使他们打开应用时,最前面五条新闻都是他们感兴趣的话题。

新的 Google News。图/TheVerge

新版 Google News 还推出了一种叫 Newscast 的服务,是 Google News 专用的新闻广播,它看起来有点像 Instagram Stories,提供某条新闻视频或者引言、摘要,让用户获得基本信息,以便他们决定是否深入了解某个故事。

如果想深入了解某个特定主题新闻,Google News 希望其“全面覆盖”功能可以作为一个重要工具。它汇集某件事情背后的多方报道、实时社交媒体讨论,最后按时间线顺序排列。

同时之前浏览器里的一键订阅媒体功能也放到应用里,有 60 多家主流媒体。

Google 地图支持 AR 导航。这是 Google 所称的“视觉定位系统”,即基于图像识别的实景导航,用户打开手机摄像头对准前方或者某个建筑物,取景界面下半部会浮现 Google 地图,提示行进路线、预计到达时间和剩余里程;上半截则是实时导航提示。

Google Maps 实景导航。图/Ars

另外,Google Maps 还能根据用户感兴趣的内容,以及过去给出好评的地方,在地图上显示出它认为用户可能感兴趣的地点。

从两年前 Google 把人工智能作为重心以来,今年的 I/O 算是一次相关功能的大爆发。和市场上唯一的对手 iOS 相比,Android 似乎走向了完全不同的方向。在演讲里 Google 强调 Android 是开放的,而开放的选择会带来创新,这听起来像是有所暗示。

但可惜的是,除了 Android P 中防沉迷和易用性等少数功能之外,这次 I/O 大会上展示的新功能,和中国大陆的用户大概不会有什么关系。

题图/Google

我们做了一个壁纸应用,给你的手机加点好奇心。去 App 商店搜 好奇怪 下载吧。