Claude 3 Opus改变游戏规则?!用Claude做AI Agent

作者: 黑皮诺NULL分类: 计算机技术 发布时间: 2024-04-18 11:10:28 浏览:3509 次

Claude 3 Opus改变游戏规则?!用Claude做AI Agent

会飞的蛋蛋面:
gpt4 2024-04-09不是出了吗,gpt才是第一啊

1064Leung:
现在被GPT-4-Turbo-2024-04-09拿下第一了,连第二都被GPT-4-1106-preview拿下了。 我冲了Claude会员用了一段时间,感觉Opus有点被神化。在高级数学的推理方面个人认为不如GPT4

【回复】回复 @Lejeune-z : 如果你真心不是说玩酒馆的事情,我这里可以向你道歉,对不起。我的文字里面也并没有显露出我自己高人一等——如果有你可以指出。你说的文笔比gpt好,在中文方面我也十分认同。但就事论事,你一开始说的“Opus不是玩这个领域”我是不太认同的,因为A社官方在宣传时,就是希望通过基准测试表达Opus是一个比GPT聪明的模型,那么使用它来解决涉及推理的问题也是相当自然的,并非你所说的Opus不是玩这个领域。 至于你说的排位赛的问题。因为业界必须去评判和量化模型的好坏标准的,目前无非就是基准测试——回答固定的题目记分,和排位赛——用户盲选给模型投票。我相信这两种方法是人们可以想象的去评判和量化的最好方法(具体使用的统计方法合理性你完全查询得到),这两种方法的虽然不能说能做到百分百准确,但是我相信在很大程度上能反映模型的好坏。如果你有更好的量化方案你也可以提出,但是完全说这种评判和量化是“还能干吗”的消极评论是反智的。 最后,你说“不懂的人弄错了害人,给本来就懂的人看这个,我知道答案了让你再算一遍”。我也是不太认同的,因为按照我个人的经验,解决一些数学的问题,如果稍微有点难度和复杂,需要AI百分百回答正确是不太可能的。当然它的回答可能会夹杂着“幻觉”,但是这些幻觉如果出现在需要逻辑推理问题里,是可以被人所察觉的——因为幻觉产生出逻辑上的出矛。首先,找出这种幻觉(矛盾)本身就是可以令提问者对于问题有更深入的认识。其次,不百分百回答正确,这并不代表它不能提供有价值的思路和部分正确的东西。上述两点是可以辅助提问者最终得到正确的答案的。在我看来,使用AI去解决困难的问题,核心是在于它能突破自己固有的思维,尝试新的方法。而我一开始说评论说Opus不如GPT4,所表达的具体含义是GPT4相对能提供更加准确的“方向”。通过你的言论我可以推测你是没有使用AI去协助解决需要推理的复杂问题经验的。不过无论如何,你的观点只透漏出你目光短浅
【回复】回复 @1064Leung :你真别搁这高人一等的bb,我就说一句你给我脑补这么多是吧,文学创意的文笔gpt不如Claude你试试不就得了?非要搞瑟瑟?不要拿你那点心思揣测所有人
【回复】回复 @Lejeune-z :我个人猜测可能你想讲酒馆的事,可能其他人用opus搭酒馆玩见不了光的涩涩角色扮演是他们的事,并非每个人使用Ai都是为了满足自己的情欲的,请不要暗示使用Opus有“唯一最正确”的用法。官方在推出opus的时候宣传是在MATH%、MMLU等的基准测试是完爆GPT的,这代表在当时事人类能制造出最聪明的东西,我也是针对其述,按照我个人的使用经验分析下看法,是合情合理的,并无什么不妥。
GPT4Plus各种Ai充值代:
提供美国卡代充各种Ai平台,可以选择小黄鱼或某宝进行交易,需要滴滴~[给心心]

claude 亚马逊云科技 chatgpt ai agent OpenAI github ai 科技最前沿 Bedrock claude 3 opus

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

更多相关阅读