阿里巴巴达摩院发布自研 AI 语音 FPGA 芯片,率先在天猫精灵上落地

8月21日,在美国旧金山举行的芯片行业顶级学术会议HOTCHIPS上,阿里巴巴达摩院发布了新一代AI语音FPGA芯片技术——Ouroboros。

阿里巴巴称,这是业界首款专用于语音合成算法的 AI FPGA芯片结构设计,能将语音生成算法的计算效率提高百倍以上。

(阿里达摩院科学家在HOTCHIPS大会现场发布自研语音芯片技术)
(阿里达摩院科学家在HOTCHIPS大会现场发布自研语音芯片技术)

以计算量最大的AI语音合成算法WaveNet为例,为了生成1秒的语音,CPU和GPU需要消耗50秒的计算时间,但Ouroboros在FPGA环境下只需要 0.3秒,大大提升计算效率,同时将整体服务成本降低 10 倍以上。 

这项芯片技术同样适用于达摩院于今年 7 月发布的新一代的语音合成算法KAN-TTS。自研算法与自研AI芯片设计的结合,意味着阿里在语音生成领域实现了真正的“软硬一体化”计算结构的落地。  

据了解,Ouroboros 芯片技术除了语音合成之外,还将支持AI语音识别。基于 Ouroboros 研发完整的语音AI芯片,有望率先在天猫精灵上落地。

阿里巴巴告诉 PingWest 品玩,这项芯片技术还有可能加入到汽车(比如上汽荣威)和手机上,以支持高德地图的语音交互。