小鹏汽车利用神经网络引擎推出一款全新AI声音

品玩7月26日讯,小鹏汽车宣布Xmart OS车载智能系统中的智能语音助手小P即将搭载的一款全新AI声音,并发布行业首个用户视角的车载智能语音系统评价标准,评价标准包括了“多快好爽”等四个维度。

小P全新AI声音即将上线。据了解,该声音采用 “全新一代超大规模在线神经网络引擎+小型离线拼接引擎”的技术组合,更好听、更生动,带来更接近真人的车载语音交互,进一步完善全语音车载系统的用户体验。根据国际通用语音质量评测方法MOS评测,在满分5分情况下,小P全新AI声音得分高达4.49分,是目前MOS语音质量评测得分最高的车载智能语音助手。同时,全新AI声音采用了24K采样技术,实现了高保真音质,并拥有包括助理、聊天、客服、愉快、温和、亲热、抒情、新闻、严肃、不满、生气、害怕、悲伤、冷静等14种强烈情绪的变换能力,声音细腻动听,生动自然,有真人般的气息顿挫,能表达更多情绪,几乎与真人无异。

为了让小P全新AI声音能顺利带给用户,小鹏汽车解决了时延、网络抖动、如何与应用结合等多方面技术难题,并利用智能网络预测算法预测车辆当下的网络情况,智能选择在线神经网络引擎或离线引擎进行声音合成,通过端云融合的语音合成方案,已做到97%的超高在线率,弱网和无网情况下也不用担心音质受损。

而为了帮助用户更好了解车载智能语音交互系统的表现,为用户提供简单、直观、实用的评价工具,小鹏汽车推出了行业首个用户视角的车载智能语音系统系统评价标准——“多快好爽“:

多——即指可用语音操作功能数量,用户可以用同样数量的「高频指令」去与车辆对话,可实现功能较多的车辆则表现更加优秀;

快——即指语音操作的完成效率,用户可以测试在1分钟内,连续通过语音发出指令,看车辆能完成的指令数量,完成越多则表现更加优秀;

好——即指语音播报的舒适程度,用户可以通过对比该声音与真人的相似程度、音质是否清晰细腻及喜欢该声音的程度,在0-10分内对车辆进行主观打分,得分越高则表现越好;

爽——即指语音交互的自由度,用户可以通过不同的指令和语音操作,去测试车辆是否支持连续对话、语义打断、可见即可说、多音区识别等功能,让用户在使用语音交互时更接近正常对话方式,从而在0-10分内对车辆进行主观打分,得分越高则表现越好。

小鹏汽车宣布在四个维度的盲测和众测环节均位列第一。