#1 - 2016-9-10 14:47
林卯 (✨️VIP 8✨️)
Google:我司下属DeepMind在人工智能领域又有了突破 - S1
有时WaveNet也会生成一些非语音类型的声音,如呼吸或口腔运动;这反映出一种原始音频模型具有高度灵活性。
也就是说,不仅能说话,还能具备“演技”。

这里可以试听wavenet生成的中文和英文:
WaveNet: A Generative Model for Raw Audio | DeepMind
#2 - 2016-9-10 15:19
(买漫画切记远离烂店“漫爵”&“神话典传” ...)
也就是说我们的子孙后代也有可能在摩根弗里曼去世之后能听到以他声音为旁白的纪录片了?太棒了
#3 - 2016-9-10 16:27
(Original Flavor)
还是相当牛比的
气音也可以模拟,已经相当接近于人类说话了
#3-1 - 2016-9-10 16:29
麦糕
英语的效果更逼真一点
我想到的第一个应用居然是录英语听力(bgm38)
#4 - 2016-9-10 23:10
(Information doesn't harm)
这个感觉还能做Vocaloid的调教啊,下周问问做ML方面小伙伴

一直觉得Deep Learning可以用来做Vocaloid的调教,比如用miku做翻唱,原曲和miku音源做输入,然后在输出层尽量减小,miku音源合成的乐曲与原曲的差别之类的(这个思想在图像方面已经有人实现了,比如给一个梵高对画和另外一副照片,可以把这个照片变成梵高绘画风格的样子,详见这里
不过不太了解音频处理,中间肯定有不少难点,比如如何提取音元,如何对声音进行建模(这个估计vocaloid里已经有一部分了)

不过至于复活已故配音,像1L说的纪录片旁白感觉应该可行,但是如果是二次元声优的话估计还有很大的一段距离,毕竟声优声线多变,二次元作品语气也比较夸张,目前这个还略显生硬
#4-1 - 2016-9-10 23:22
林卯
原理上应该可以。
其实我标题本来想写松来的。
#4-2 - 2016-9-11 12:34
完全没有
微软已经在这么做了
初音的竞争对手来了,竟然是微软小冰
http://bgm.tv/group/topic/340984
#4-3 - 2016-9-11 12:48
Selio
……VocaListener + 机器学习么(
#5 - 2016-9-11 00:10
(bgm38)中文真是大BOSS....
以后能够模仿角色音的话应该挺有趣的....
#6 - 2016-9-11 08:28
(実は奇跡の連続なのかもしれない)
我们需要一个deepmind日本来点歪科技树
#7 - 2016-9-11 10:20
(如果梶浦由记能再和clamp合作一次)
小冰和这个哪个更厉害呢?
#7-1 - 2016-9-11 12:50
林卯
目前还没战过…
#8 - 2016-9-11 12:37
(就是没有)
未来用处一是人工智能助理的语音合成,二是把一个人的声音转换成另一个人的声音。