“第一次,中气十足的虚拟歌声” 微软小冰人工智能演唱模型新版本技术说明

滚动
2019
04/03
05:03
分享
评论

【2019年4月3日,北京,微软(亚洲)互联网工程院】

今天,我们很高兴地宣布,微软小冰基于深度神经网络的歌唱模型,已顺利完成V5新版本的研发。新的V5模型实现了重大突破,它使微软小冰第一次能够像人类歌手一样,使用充沛的“中气”来烘托演唱,从而将人工智能虚拟歌声质量提升至新的高度。此外,该模型不仅限于优化微软小冰的声音,还支持对任何人类歌手的声线进行学习、模拟和建模,演绎与再现歌手们巅峰状态下的演唱水平。作为技术示例,我们与日本唱片公司AVEX合作发行的新模型DEMO曲《最高新记忆》,也于今天同时公布。

微软小冰是一个覆盖对话、多重交互感官与内容服务生成的完整人工智能基础框架。其中,“人工智能创造”(AI Creation)是该框架的主要分支之一,它通过我们所研发与持续更新的人工智能技术,大规模学习并掌握人类文字、音乐、绘画等内容创造能力,再发挥人工智能的稳定性及高并发特点,为内容产业的未来变革蓄势。我们将在今年五月召开微软小冰人工智能创造的年度说明会,今天的新版本歌唱模型及DEMO曲,是该说明会的若干前置披露之一。

我们很高兴与行业分享微软(亚洲)互联网工程院在深度神经网络歌唱模型方面的最新进展。中国古时不乏对音乐之声的精辟论述,例如“丝(丝弦乐器)不如竹(管乐器),竹不如肉(人声)”,为其“渐进自然”。因此,我们把不断趋近人类歌手的声音合成质量,视为“人工智能创造”分支的最高技术目标。在上一个版本中,实现了小冰在虚拟演唱中的自然换气。今天推出的新版本,则进一步将“气息”应用于演唱全过程,使生成的歌声接近专业人类歌手,并可预测并自由切换演唱技巧,突破了传统单元拼接技术音高与音准的“软件乐器”标准。我们用DEMO曲来表现这一技术对照的明显差距,请重点关注歌曲时间轴上的以下时刻:

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表国际科技要闻的观点和立场。

相关热点

伴随移动互联网的普及和下沉,移动互联网新兴招聘APP层出不穷,给求职者找工作提供了更多便利化、个性化的选择。个推大数据对2019年春节过后求职类APP的行业概况、活跃度、用户画像等进行了洞察,为你一一揭晓求职的“故事”。
滚动
下一个趋势在哪里?零界·新经济100人2019年CEO峰会邀你一起探索未来
滚动
国双斩获双重荣誉!深耕产业AI布局数字化转型时代
滚动
Pico发布G2 4K新款VR一体机,“看得更清,玩法更多”全面开启VR超清时代
滚动
安顿心脑风险人工智能联合实验室在北京成立
滚动

相关推荐

1
3