这是一个创建于 2440 天前的主题,其中的信息可能已经有所发展或是发生改变。
现在很多深度学习都是针对图像的,比如识别和换脸等项目。请问是否存在更换声音的项目呢?
比如,使用一个人(声优)的大量数据作为素材,使得以后你说的每一句话都可以被替换为该声优的声线。我依稀记得某个公司实现过,但是找不到了。另外自己做能通过 TF 实现吗?
小白求问
2 条回复 • 2018-02-15 17:30:05 +08:00
|
|
1
inflationaaron 2018-02-14 08:34:26 +08:00 via iPad
当然有了,Deepmind 的 WaveNet 就可以实现
|
|
|
2
kslr 2018-02-15 17:30:05 +08:00
Lyrebird
|