【AI人偶】朗读爱伦·坡《海中之城 (The City in the Sea)》

作者: Weiss°分类: AI音乐发布时间: 2023-05-21 12:24:43 浏览:71768 次

Weiss°:
[吃瓜]1. 报告一下呼声比较高的玛利亚师姐模型，结论：不行。2分47秒的语料你们这是想上天…… 提供不了成功经验，但能提供大量失败经验[吃瓜][辣眼睛] 音色问题： - sovits4.0练过一个v1版本的（忘记选768了，虽说估计选了也救不回来），音色沉是沉下去了，但它还闷，柔和沉闷，完全丢失了训练语料的那种清澈感，应该是底模影响？ - 训练聚类，自己都被自己逗笑了，第一次见到有模型因为语料太少而不能训练聚类的……后来把人偶的语料混进去练出来了，但没什么用。 - 尝试sovits模型混合，混人偶和师姐，图个乐，好听但不像。 - elevenlabs，这点语料丢进去elevenlabs本来就完全不像，有什么好说的，确实比sovits发音清澈倒是真的。 - 丢进DDSP，记得选768了，想试试带扩散模型玩，没用，跟sovits一个样。推理质量问题： - 不管用什么预测器、用不用聚类、扩散多少步，或者什么乱七八糟的设置，都明显暴露出模型确实缺乏克隆各种发音技巧的能力 - 电、糊、哑、跑调推理素材问题： - 油管翻遍了，师姐这个气质太难复刻了，不像防火女和人偶，低缓平和就完事了，师姐声音是带点慵懒忧郁又有压迫感的气场的，还要找个符合风格的让模型学，真能把人找崩溃…… - elevenlabs刷过一会碰运气，不太好刷，毕竟要求相当刁钻，当保底用 - 找到了稍微沾边的，丢进去就又是以上提到的所有问题集中出现血的教训，别练小模型！

【回复】辛苦了蹲一个修女（可想而知又是语料太短？
stellar_ave:
[脱单doge]好！想听玛利亚师姐朗读玛莉·伊丽莎白·弗莱《不要站在我墓前哭泣》[给心心]

【回复】[笑哭]感觉有难度，玛利亚素材两分半，只练她自己的肯定不像，加上人偶一起练，人偶八分多钟那就还是练成人偶……
【回复】回复 @反对历史饭圈 :我知道但语气不一样师姐仔细听的话更加低沉忧郁中带着一丝温情人偶相比之下更像是温情中的忧郁
【回复】玛利亚的配音演员和人偶是同一个
伏龙芝都得不到的添彩:
天哪，之前只是听说，现在这个视频才让我直观感受到AI仿真有以假乱真，血缘人偶妹语音demo曾是入睡必播放首选……门外汉小声问一下，从训练模型到制作出这个视频，大概要多少时间？用到哪些工具？一个新人学这个要具备哪些技能？

【回复】耗时无法回答，影响因素实在太多太多了[笑哭] 主要涉及sovits 4.1（其实就用了4.0的v1反正最新版本4.1就说4.1了）, levenlabs, adobe audition, 也可能需要autodl云端训练，此外取决于你的需求可能用uvr5 和ripx 看着很多其实什么都不用懂（实在需要的话最好懂一点英语……不然碰到各种奇怪报错头皮发麻），只要清楚自己的需求、能清楚描述需求就水到渠成了，反正遇事不决问chatgpt、问群友、查说明文档，足够解决绝大部分问题
【回复】回复 @marshmaro : 不需要，chatgpt + b站大佬整理的懒人包 + 只要看得懂中文就会用的傻瓜式weiUI 足够帮你跳过绝大部分基础门槛……因为你不用扫盲式把所有基础知识都看一遍，你只需要找到实现特定需求的方法就行，chatgpt在这方面相当理想（如无意外你会碰到不少看不懂的词，哪里不懂问哪里....
【回复】感谢回答[无悔华夏_点赞]，非常想掌握这种技能以后听喜欢的文章小说就能自己设置喜欢的音色嗓音了[星星眼]英语和魔法上网都没问题，ChatGPT有渠道但是国内的原因限制颇多不过基本能正常使用；还有个小疑问，学习使用这些工具之前，是不是先去掌握一些计算机相关的基础知识和技能比较好啊，比如Python之类的这样后续进展可能轻松一些，我的意思是，是不是对于计科相关专业的人士，入门门槛不高，但对于非计科相关专业的人来说，可能先去学习一些原理类的知识后才能摸到门槛(可能？)
无尽家族-死亡:
希望up下次可以让玛利亚师姐读H·P·洛夫克拉夫特创作的诗歌《复仇女神》

【回复】[笑哭]感觉有难度，玛利亚素材两分半，只练她自己的肯定不像，加上人偶一起练，人偶八分多钟那就还是练成人偶………
mc鸡翅猪:
up是懂的，血源角色读爱伦坡，这很哥特！

CATALYSTEAR:
可以放进采样里做说唱的intro吗[星星眼]

【回复】回复 @Weiss° :转不出来音频，时长太长了，你可以给我发音频文件吗up
鵝卵石驚險又刺激:
请问为何会复现朗读的语调和节奏，AI是通过学习别人的朗读视频还是说把文字输入进去他们自己就会朗读

【回复】…这…从我极其不专业的角度来看，应该是ai学习了大量说话的视频，掌握了人说话时的发音规律和节奏，加上语义分析，从而实现文字转语音时生成能理解文本情感的朗读的效果
又上医院:
感觉太快…有种用轻声快说话的违和感

天下悠悠之口:
up总是会接一个小停顿，而且up的发音怪怪的，再就是如果能再慢一点就好了。

【回复】回复 @天下悠悠之口 :哈哈哈确实[笑哭]原来是这个意思
【回复】回复 @草日四柚 :怪我没说清楚，是UP这个单词[笑哭]你从1:05那里听
【回复】这不是up念的呀（还是我老实人了？
孤独的老猎人:
愿我在清醒的世界也可以听到人偶呼唤我

账号已注销:
最近看了坡老师的阿戈皮姆历险记，一个航海冒险记都能整得这么整这么多活，死人之船，食尸……坡老师总能让人眼前一亮[吃瓜]

傍晚7点半:
起初就是为了听人偶说话，买了ps4和血缘

血源诅咒 AI 人偶 AI虚拟之声实验室虚拟之声创作计划·2023第二期

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！