小冰框架下 X Studio・歌手基于深度神经网络的歌唱模型,已发布 V1.7.0 版本。新版本基于 Xiaoice X Studio DNN Singing Model V6,让小冰框架内的人工智能歌手拥有了音量、气声、等更多参数,将人工智能虚拟歌声的音乐表现力提升至新的高度。
X Studio・歌手新版本不仅限于优化人工智能少女小冰的声音,还支持对框架内任意人工智能歌手的声线进行演绎。
IT之家获悉,官方介绍,X Studio・歌手 V1.7.0 实现了云端 AI 语音合成的架构优化,极大提升了云端合成服务的速度与稳定。目前,X Studio・歌手在调音时候的响应时间仅需 0.5 秒,极大提高了用户的调音体验,是全球合成速度最快的云端 AI 歌声合成软件。
在之前的主要版本中,X Studio・歌手已引入了自注意力机制和判别模型,当 AI 歌手要去完成一段演唱时,模型会根据仅有的简谱和歌词信息,快速计算出一系列声学特征;还实现了 AI 演唱的自然换气、以及将“气息”应用于演唱全过程,预测并自由切换演唱技巧,突破了传统单元拼接技术音高与音准的“软件乐器”标准,实现了多声部的合成技术。