#1 - 2019-7-19 15:24
snylonue (表达能力极差)
手上有一段很长的音频(2:31:09,163.54MB)要转文字,中文,比较清晰,有些杂音
试过autosub,挂了一晚上显卡驱动都不正常了
记得以前看到过类似帖子,但是查资料查得眼睛疼,翻了一会没翻到,就来这里问了
会写python脚本,api什么大概可以
不用太高的准确率

讯飞上氪金解决了,眼睛疼不想折腾了
#2 - 2019-7-19 15:31
(一个纠结的面瘫伪宅)
讯飞
#3 - 2019-7-19 15:44
(Seventy Seven Letters)
STT?上学期项目做的是这个不过是英文环境…
Google API(https://cloud.google.com/speech-to-text/docs/async-recognize)里面就有中文的package(https://cloud.google.com/speech-to-text/docs/languages),准确度待考。
语音太长可能要考虑用FFmpeg(http://ffmpeg.org/
#3-1 - 2019-7-19 16:10
snylonue
Google?网络不行(梯子太渣(bgm39)
#3-2 - 2019-7-19 16:42
久远寺有珠
Snylonue 说: Google?网络不行(梯子太渣)
那…试试Github上其他的开源代码吧,关键字speech to text,stt,speech-to-text应该都行
#3-3 - 2019-7-19 20:28
snylonue
久远寺有珠 说: 那…试试Github上其他的开源代码吧,关键字speech to text,stt,speech-to-text应该都行
谢谢,已经解决了