新发布的gpt-sovits效果太逆天了,以至于我忍不住想发出来。

作者: 这就是b站吗alal分类: 数码 发布时间: 2024-01-29 22:32:45 浏览:78199 次

新发布的gpt-sovits效果太逆天了,以至于我忍不住想发出来。

67861413191_bili:
效果真的很好,没想到开源免费都进步到商用水准了,这些大佬真的牛,感谢啊[爱心][爱心][爱心]

【回复】真的,感觉这样发展下去明年音色方面应该也会迎来一大进步,真的就几乎完美复刻声音了。开源的大佬真的NB,普通人也能接触最前沿的技术,开源精神赛高[打call]
【回复】回复 @这就是b站吗alal :[doge]花佬牛逼
爱吃烤蓝莓:
牛的,我克隆自己声音主打的就是一个丁真,给我电麻了

朽木真的木:
怎么解决吞字问题阿,中间会有些字甚至句子跳过

【回复】自动生成了文字list以后,要点进去仔细检查,看看断句是否和逗号或者句号匹配。整体训练集说话语速要均匀,说话不能一会快一会慢,语速不一致的切片可以直接删掉。最后就是参考音频不能太长,5秒左右合适,吐字要求清晰,没有吞字漏字。这样下来推理的时候几乎就不会有吞字漏字或者参考音频乱入了。
【回复】Chatgpt选轮数低一点的模型会好点
【回复】回复 @大白鬼罗与咸鱼 : 对,这应该是gpt的特性吧,具体原理我也不清楚,但就像chatgpt一样同样的输入输出会不一样。这种性质在语音合成我觉得是好事,每次合成语音都会不一样,多了分人味,少了些ai感。
笑草玛格基:
直接解压覆盖花儿不哭的整合包就可以吗?

RUNAWAYWHITYOU:
这个可以用我的录音克隆成我爷爷的声音吗,还是只能按照文本读

【回复】方言没试过,按道理是可以的但是效果可能不理想。克隆以后可以输入文本然后读出来。可以等等以后技术继续发展,到时候效果会越来越好,相信可以复原你爷爷的声音的。[脸红]
RUNAWAYWHITYOU:
这个可以我录一段方言语音,然后克隆成我爷爷的声音吗,可以吗

Wangzi220:
问下兄弟们,如果是训练自己的声音,声音多少分钟比较合适?读什么文本比较好?读鲁迅的文章可以嘛?我用苹果手机录了一段四五分钟的自己声音的干声录音,然后训练出来总是有点电音,不论是训练轮数怎么调整都还是怪怪的,貌似是手机录音有点破音?我拿去urv5降噪了也没用,还是有电音,我是台式机4080显卡,求兄弟们指教

梦眼剪辑:
帮推理吗,有偿(本人电脑真带不动[doge])

回收杠铃:
up你好、请问你知道 为什么上传后的切割语音片段和输出的都是1.5倍速而且选择倍速无效呢

花儿不哭 女声 gpt-sovits 语音合成 文字转语音 文本转语音 tts 声音克隆 vits

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读