现在有哪些开源的语音识别方案可以识别文字并返回文字所在帧数吗?
1
darkscope 2021-02-19 13:56:02 +08:00
先用讯飞的写呗,功能 work 了再考虑替换
|
2
catsoul 2021-02-19 14:13:36 +08:00
如果我没记错的话,前几年有这么个东西
|
4
retrocode OP @darkscope 是滴,突然的想法,先做个技术选型,不然库是 JAVA 的,结果我做的 electron 就哭了.
|
5
murmur 2021-02-19 15:02:53 +08:00
根据文字合成鬼畜视频?这样的鬼畜有什么看头么,鬼畜又不是根据声音拼素材,口型同步基本都不做的,还是看创意,要么就改歌
|
6
catsoul 2021-02-19 15:19:21 +08:00
@retrocode 名字我不知道,之前在朋友圈蛮火的,一句普通的话输入进去,它自动从影视素材的片段库里找到每个字或者词的对应片段,然后合成一个小视频那种。但是因为他没有做语音的平滑处理,所以跟我们常看的鬼畜视频不太一样。
|
7
lovecy 2021-02-19 15:26:23 +08:00
把流行的素材整理成素材库,文字对应素材库里某个素材的某一段,不就行了,也就是只要有一个人有音频识别文字,大家都能用这段素材了。
|
11
GTim 2021-02-19 17:00:23 +08:00
说起这件事,我一直很想做另一件事: 汉字常用 7000 左右,常用词语 10w+ 也就是说大概 11w 左右就可以了。剩下的汉子用同读音的汉字来替代就好了。然后,找个语音助手,慢慢把这 10w+ 抓下来就可以了
|
12
baobao1270 2021-02-19 20:12:48 +08:00
不是开源但是不要钱,UTAU 了解一下
|