数字人新升级效果,你敢信这不是真人?

作者: 特看科技的滚石分类: 极客DIY 发布时间: 2023-06-14 18:55:07 浏览:65168 次

数字人新升级效果,你敢信这不是真人?

百珏st:
讲讲个人理解: 本质应该是有TTS的 先根据文字生成对应的音频文件 (接三方或自训练) 产生mp3 || wav 文件 开源的驱动嘴唇的项目 不过这个还有动作 应该不是sadTalker 可能是video-retalking 或者 wav2lib? 不过开源项目 后期进行图片增强 哪怕采用 codeFormer 还是 GFPGAN 应该达不到图中的效果 比较好奇这块是怎么做 结合UP是deepFaceLab的作者之一 有可能是 图像增强的时候 走的是deepFacelab 那个换人脸的技术路线??? 不过总结来说 UP主是个大佬[呲牙]

【回复】回复 @合金弹头9898 : 比较好奇的事 你从何说出我是不懂装懂的? 我只是基于我自己的见解表达了从我自身的角度对这个视频的看法。 而你要反驳我却只是浅显的说了一个目前无法达到? 我想问的是你基于哪些方面得出这个结论? 是有自己训练wavlip2的更高分辨率的模型 和基于大量中文数据训练的模型吗?反驳我请携带比较足够分量的证据,而不是开口闭口就是“不懂装懂” 再者你说是视频换脸 那你应该清楚 deepFaceLab项目 以up主对这个项目的熟悉度 我觉得他没有必要在这个方面骗人[翻白眼][翻白眼][翻白眼]
【回复】开源的嘴唇合成算法都达不到商用效果,综合各类开源算法,自己重新设计的一套嘴唇合成技术
【回复】回复 @合金弹头9898 :不要不懂装懂,这其实就不只是一个视频换脸而已,或者根本就不是一段真人主播录像而已!!不要别瞎想!数字人技术已经能远远达到如此真实和流畅的!
NE0NE:
主播是假的,声音是假的,货也是假的,只有各位的钱是真的[doge]

【回复】回复 @Great_Red_Dragon :是的,但是为什么你要说出来[doge]
【回复】我的钱也只是一堆数字,也可能是假的
戈百狸:
就是换脸,声音应该是真人的,换声音还会突然有BGM,换脸嘴型对的也不好,我们都是直接用的3d的还能自动对嘴型动画

【回复】并没有换脸,这是音频驱动数字人,不是换脸
【回复】你好可以交流一下 您用什么框架吗
zhang乐子:
这不就是通过音频自动对口型的那个AI吗

【回复】回复 @Waterless_wsry :chatgpt输出直播文案,tts转为话术音频,然后驱动数字人直播讲解,中途抓取用户评论,触发自动回复互动,这难道不GC么
【回复】对啊,终于有个明白人了
【回复】回复 @滚石滚滚 :那实际上不还是换皮吗,这是和AI沾边了,那GC呢?在几年前这产品或许能叫数字人,现在大家对数字人的期望除了要有虚拟形象,更重要的是能做到内容产出。
manyanfei521:
给大家科普一下,人物是真人用摄影棚拍摄的,然后后台根据你输入的语言自动匹配嘴形,但是面部现在市面上基本没有匹配完美的,另外肢体动作就那么几下子就算可以打破顺序生成也就是光说肢体语言基本重复,最恶心的来了,这种软件收费非常不合理,并且不给你试用,国外网站那些正规的都是可以试用,让你看看效果再决定是否入手,这种软件试用都不给你猜是为啥,[脱单doge],试用的话大家估计都不会买了,韭菜吗能有一个是一个,水军买一点,评论各种好评让不明是非的人好上当

【回复】开口就喷shit的就是你这种人,所以我根本不接小客散客的单,只和明事理的大品牌合作,所有都是可以试用,并且按月付费,效果不好可以随时退 国外网站我猜你想说heygen,你可知道heygen创始人是两个中国人,诗云科技,两三年他们创始人徐总还来杭州当面约我吃饭邀请我一起跟他们创业,至于为啥徐总要邀请我,开动你的脑子想一想,是我割韭菜水平高,还是我技术好
【回复】回复 @滚石滚滚 :还说什么“给大家科普一下”,恶心
【回复】我就说么 人物面部和动作有点真实。刚刚看了华为的那个我都以为华为落后太多了。现在纯生成的数字人技术还是有很多机械感,差距还是很大
账号已注销:
动作和表情是提前录好的,只是根据语言匹配嘴型。如果动作和表情是ai实时驱动的话,up你起码领先现在做数字人最好的epic公司10年。可能吗?

【回复】跟epic的三维方案完全是2个路线,不挨着
豫让击衣:
这种效果一看就是本质换脸 。。。需要人演得

【回复】VITS+GPT关键词回复,已经可以做到全自动数字人了
M5578954479:
人是真人吧,通过AI把不同语言的口型修正,我说的对吗?前几天看到过有这种模型

胡刚27:
明显真人预录的视频模板,现在最牛逼的公司也没办法做出这样真实的虚拟人物

【回复】最牛逼的公司是?让我看看你对最牛逼公司的理解
青春无敌小虎虎:
说到底还是真人驱动的,起码文本tts转RVC合成才有意义,不然和动捕的3D人有啥区别

扑面而来的安全感:
随便发个视频,然后说这是ia,真有你的。我知道ai题材很火爆,但不好意思这种浑水摸鱼的骗骗老头老太太去吧。

王牌作监:
就直接告诉我,视频里的人是真人还是模型?

贝哥2015:
你这是广西北海的国家数字人计划吧,联合国教科文组织推荐的项目哇

【回复】回复 @懒同学嘎 : 几百块一个月的是录播方案,提前一天合好视频第二天用,所有内容都是固定死的,所以封禁概率极高,这种就是纯属割韭菜,忽悠小白说这是直播数字人,实际就等于录播,卖一个割一个。我们这个是实时驱动,数字人要讲的话术可以实时随机选,也可以真人话筒接管驱动,跟这种几百块的不一样。 你另外说的两点是对的,这个只是个主播工具,直播效果最终还是要看运营、要看品,不适合真人直播都没运营过的商家来用数字人,这种商家来找我,我也不愿意接。直播互动效果和真人比那肯定比不过真人的控场能力,但胜在成本低,我们几个大品牌客户测试对比过真人和数字人ROI,最高达到真人的80%ROI,用于真人主播下班后代班效果就很好,把半夜主播下班的时间也都利用了起来,也有真人和数字人同时出镜的玩法,适合一些大V复刻数字人形象后直播,效果比员工真人直播要高出一个数量级
【回复】回复 @滚石滚滚 :现在的市场价位已经到了几百块一个月的水平,腾讯智影百度智能云还有一些大厂都有在做这个项目。而谈到用于直播,一方面平台管得比较严,这种形式会被判定无人直播,在某直播电商流量最大的平台没有办法开展;另一方面使用成本比较高,学会这个工具的使用往往需要专业的团队,或者说以比真人主播更高的成本去请一个专门的运营。另外还有更致命的一点,是它的互动效果和直播展示并没有那么的生动,直播效果并不好。
【回复】回复 @滚石滚滚 : 就你和上面那些人喷,不解释关键点,你也只喷,怕是没啥口碑了吧,老弟。
吉嘿嘿869:
这用了什么技术啊,我想了解一下学一学

【回复】按上面这位老哥说的,在github上确实有开源码,运行了一下有门,但口型和动作比这些商用的还是差点意思
【回复】回复 @守望者yq :肯定可以啊。项目应该是开源的吧,把代码、软件下载下来,打开软件,把你拍好的视频塞进去计算,最后输出成新视频。过程操作是这样,不过你就得先去github看看有没有的代码、软件下载,下载之后你还得研究研究代码怎么运行(看你有没有代码基础了)或者人家已经是打包成应用软件了(就是有.exe运行程序了),你也得研究研究软件怎么用。做事肯定能做,都已经是公开出来的项目了,只是会者不难,难者不会,外行看着像魔法,内行还能说折腾几下
【回复】回复 @守望者yq :既然你都这样问了,那我只能遗憾的告诉你你不能

AI数字人 虚拟主播 数字人 数字人直播

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!