GPT-SoVITS,参考音频筛选工具介绍、使用和分享

作者: 风轻云淡还重复分类: 计算机技术 发布时间: 2024-05-03 08:34:05 浏览:1601 次

GPT-SoVITS,参考音频筛选工具介绍、使用和分享

天缘傲:
有win10 系统的兄弟测试过么,能不能在win10 下跑通啊,

【回复】如果要下的话,下6月22的吧,老版没修微调未读取bert文件的bug
【回复】回复 @风轻云淡还重复 : [打call]感谢大佬,其实除了参考音频的筛选是一个痛点之外,还有一个,就是模型的筛选,一般来说数据集质量好的坏,训练20轮就够了,一般来说第15轮效果最好(空耳听的),但是如果是数据集质量差的话,提高训练轮数是可以提高音频生成质量的,但这儿玩意儿不是训练轮数越高质量就越好,而且和gpt模型和sovits模型并不是对等叠加效果就好,可能gpt5轮和sovits70轮效果好,也可能gpt20轮和sovits10轮效果,所以就需要跑很多次来确定那个搭配是最优选择,如果能一个参考音频一次跑多个轮数的模型就更完美,希望up得空开发一个吧[打call][打call][打call][打call]
道各二世:
大佬,你是用什么算法对比的句子的相似性

【回复】不是大佬,文本相似度是用chinese-roberta-wwm-ext-large模型比较的,比较的代码是从通义千问那要的。音频相似度用的是阿里的speech_campplus_sv_zh-cn_16k-common
戦场原礼亚:
大部分情况是。下载的别人跑号的模型,根本没有list文件及其相关音频资源,哭死

【回复】所以,这个工具更多是针对模型训练者而准备的。
稳乐哥:
您好!GPT-SoVITS 模型列表,刷新了还是选不了,没反应是什么原因?

【回复】这不是官方整合包吧,不太清楚。不过一般找不到模型的话,可能是你的模型没有正确生成,或者放错了位置。
【回复】回复 @风轻云淡还重复 : 谢谢!
十三维度142857:
非常好的项目!特羡慕你们懂这方面的人才,有好的想法都能实现,我有些想法只能定制或给你们建议,哎,大学时候应该学习计算机专业!悔恨啊

【回复】现在也可以学啊,Python门槛不高,尤其是现在有大模型加持。 我主业是Java,对Python也不太了解的,基本都是遇到一个问题就去请教一下大模型。主要是阿里的通义千问和chatgpt4(字节的海外版coze可以白嫖),大模型基本可以给一个大差不差的答案,如果一个模型给的答案不太对,那可以多试几个,不是太冷门的问题,都可以找到合适的答案。 实话实说,这个工具,除了界面主要是我写的外,其他代码要么是从主项目copy的,要么就是让大模型生成,然后我稍微调试一下组装起来的。 我主要的工作就是把一个大问题拆分成n个小问题,然后将这些小问题描述清楚丢给大模型去生成代码。
【回复】回复 @十三维度142857 : 算不上大佬,普通开发。B站的Python教程视频我没怎么看过,不太清楚。不过,在大模型出来之前,这个或许可以作为一个不错的入门教程,但是在大模型出来之后,这类视频,可能更多的是一种查漏补缺的作用,以及帮助没用过代码开发工具的人,了解怎么使用吧。 现在的大模型实际上类似于一个可以随时提问的私教老师,而且是知识储备非常广的那种。有什么不懂得直接去问,比文档和视频,要灵活得多。国内的通义千问,国外的chatPGT,都很不错。
【回复】大佬,在B站看Python教程视频能达到入门级别吗?

教程 GPT-SoVITS 软件分享

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读