【AI听书】开源免费!让喜欢的角色给你读书!【API for GPT-SoVITS】

作者: 箱庭XTer分类: 软件应用 发布时间: 2024-02-17 12:00:00 浏览:192978 次

【AI听书】开源免费!让喜欢的角色给你读书!【API for GPT-SoVITS】

遗风在此:
阅读是本地的,模型是本地的,懂了[doge]

【回复】虽然,是可行的[脱单doge],你猜我为什么特意双开了一份阅读app
【回复】回复 @单笔简书 :不是一个赛道的[doge],静读天下是本地阅读器,而阅读主打是换源在线阅读
【回复】回复 @箱庭XTer :up主,现在阅读是不是抓取不了一些小说了,比如飞卢的,看到vip章节就不能看了,起点的也是。
去吹吹吃吃晚风吧:
双击bat后显示“系统找不到指定的路径。”要怎么解决呀up

【回复】你先看看readme,这个目前是要依赖2.14版本以后的GPT-sovits项目的,如果还不行可以截个图发给我看看[抱拳]
【回复】回复 @箱庭XTer : 我也是显示缺少flask,卡住了不知道怎么弄,更新到项目最新的bat在最新的整合包里也没看到[笑哭]
【回复】回复 @箱庭XTer : 我手动pip install flask了,还是说No module named 'flask'[笑哭]
aass12321:
这个技术,有没有可能,给原神的支线剧情配音?

【回复】感情起伏不行,你让他读一段动作描写就知道了。
【回复】不行,情绪起伏不大,如果在剧情里你会觉得很怪,明明剧情胡桃在生气结果语音确实平淡的
【回复】米忽悠有这个技术,但是不用,毕竟涉及到版权合同等问题[吃瓜],这对cv来讲多少有点卸磨杀驴了,而且文本量太多内存也撑不住 隔壁未定的莫弈就是ai配的,不硬挑的话基本挑不出来什么太大差别
龙门小信恭-小神:
小白:好有意思我去试试! 下了一堆东西:额?要不算了?

【回复】真正阻拦我的是硬件,没有显卡[藏狐]
【回复】回复 @都好都好左 :cpu就可以推理了
沫个鱼:
这个功能已经有up主做了,还可以接入multitts和tts server来实现多角色朗读,目前最大的问题还是gpt-sovits太吃配置了,合成速度真的是硬伤[笑哭]

【回复】合成我用4060ti,十个字的句子要好几秒。这个可以工程上可以解决的。预加载几个语音到本地当buffer就行了,就是先预加载一章语音,听第一章第一段时,程序实际上在转换第二章第十段。听第二章时,程序又跑到第三章了。当然现在应该不行,gpt-sovits太吃算力了,推理还需要优化。手机肯定很难跑
【回复】回复 @浅月玖慕璃 :@CyberWon 这个
【回复】合成速度10个字还要1s左右 很难受😣
小波士顿赛雷可汗:
现在的ai能不能做到自动分清男女角色对话,然后分配男女语音?

【回复】感觉这才是我心中tts应用在读书上最重要的一个组成部分,听男声读女角色对白太难受了,但以前接触的tts都没有能做到这一点,也许这是个很高难度的技术?
【回复】要训练,目前为止只有人工标识做出来了
【回复】回复 @小波士顿赛雷可汗 :可能会很费事吧,毕竟要通过角色名字来判断性别
无认识论焦点的明确:
可以用到手机上吗,感觉电脑好麻烦。

【回复】你手机需要外接一张显卡,
【回复】手机下载一个软件D·TTS Serber 再下载一个支持朗读引擎的阅读软件,在把D·TTS Serber 导入朗读引擎,可以使用微软的语音线路,听书杠杠的可以说,和小说推文那种声音差不多[OK]
【回复】手机上有类似的,但读出来还是有很多问题,比如漏字还有很多多音字读错的,以及生成时间太长
没有了名字呢:
那可不可以给手机 阅读3.0的配套朗读引擎TTS Server 添加自定义胡桃音色的TTS[大笑] 期待有大佬可以整出来[星星眼][星星眼][星星眼]

【回复】我一直在用TTS自带的那几个声音[笑哭]都听腻了
【回复】已经有大佬整出来了,就是效果没这么好@CyberWon
【回复】回复 @CEH0529 :大佬发新视频了、还原度跟奈斯。。。
箱庭XTer:
2024.2.26进行了史诗级大更新!还增加了模型管理与前端,请看github和语阁:https://github.com/X-T-E-R/TTS-for-GPT-soVITS ;https://www.yuque.com/xter/zibxlp/nqi871glgxfy717e ;另外我还创建了一个群聊,有问题可以加群:863760614 探讨!

【回复】弱弱的问up能不能弄出来单田芳老师的声线,我从小听评书,评书人讲起书来那可真是个绘声绘色,这实现起来难度一定不小,如果能用最近火的AI声音复刻出来,也算是对艺术的传承吧
【回复】回复 @千里灬寻 : 您好,当然可以试试:有什么你觉得他说的最经典的节目/视频/广播(音质又相对现代)的吗?可以告诉我一下,我来试试
【回复】语雀,不是语阁,拼错了()
草草露璃娜:
up为什么你的模型推理这么快啊[星星眼]指哪读哪

【回复】我用的是3090,然后阅读设置拆长段,这样开始阅读前大概等个几秒开始读第一段,之后就是能正常顺延
【回复】回复 @Godseeker : 拆长段在tts server里 哎 我3060ti开了拆长短的停顿还是有一点点长 又在诱惑我升级显卡
【回复】回复 @箱庭XTer :那开始一句话大概要多久呢3090
雁渡寒潭L:
那太好了,可以让郭德纲给我读小说了

【回复】,=哦! 。=是嘛! !=嗨~ ?=怎么说?
【回复】回复 @姨妈的父亲 :于大爷负责念标点符号[OK]
【回复】亲爱的听众朋友们,接下来到了我们的恐怖故事吓死人节目时间,35 岁以上的听众朋友请在父母陪同下收听[doge]
bili_74980247850:
听书还要电脑?在外面还得内网穿透?[辣眼睛]

【回复】回复 脑瘫好惨 :MultiTTS现在可以分角色配音,只是手动设置比较好,自动分配容易不准。
【回复】回复 艾丽梅尔 :MultiTTS现在可以分角色配音,只是手动设置比较好,自动分配容易不准。
【回复】回复 @脑瘫好惨 :那不行,这种需要模型解析,应该没有tts能做到
Hamanecer:
【时间线】 - 00:00 - 00:30 🤖查克花儿不哭大佬介绍其开源的人工智能语音合成项目,展示了其作为听书软件的潜力,并现场演示了效果,包括演唱《红鸾喜》。 - 00:30 - 01:00 🎭描述了《红鸾喜》表演者的扮相和表演技巧,尽管声音细小,但表演得到了观众的认可和掌声。 - 01:00 - 01:30 🏪讲述了一个关于咸亨酒店的故事,同时介绍了如何安装和使用这个语音合成项目,包括配置和运行步骤。 - 01:30 - 01:46 📜强调了该语音合成后端程序的开源性质和MIT协议,提醒用户自负使用和传播的责任。 【摘要】: 查克花儿不哭大佬介绍了其开源的人工智能语音合成项目,展示了其作为听书软件的潜力,并现场演示了效果。项目配置简单,用户可以按照教程安装并使用。同时,强调了项目的开源性质和用户自负责任的重要性。 --本内容由@DDD_cat生成,正在用心做一款AI工具~,欢迎访问我们的网站:https://ai.ddcatai.com, qq群:936605738

苏尔尔尔:
角色正则表达式感觉还得加强,角色老是容易读错[笑哭]

【回复】其实这个是可以自己人工筛选的。如果是追求质量的话可以一句一句去生成,生成出自己想要的效果。

黑科技 TTS AI 崩坏:星穹铁道 GPT-SoVITS 听书 声音克隆 原神 这就是AIGC

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读