Claude 3 Opus改变游戏规则？！用Claude做AI Agent

作者: 黑皮诺NULL分类: 计算机技术发布时间: 2024-04-18 11:10:28 浏览:3509 次

会飞的蛋蛋面:
gpt4 2024-04-09不是出了吗，gpt才是第一啊

1064Leung:
现在被GPT-4-Turbo-2024-04-09拿下第一了，连第二都被GPT-4-1106-preview拿下了。我冲了Claude会员用了一段时间，感觉Opus有点被神化。在高级数学的推理方面个人认为不如GPT4

【回复】回复 @Lejeune-z : 如果你真心不是说玩酒馆的事情，我这里可以向你道歉，对不起。我的文字里面也并没有显露出我自己高人一等——如果有你可以指出。你说的文笔比gpt好，在中文方面我也十分认同。但就事论事，你一开始说的“Opus不是玩这个领域”我是不太认同的，因为A社官方在宣传时，就是希望通过基准测试表达Opus是一个比GPT聪明的模型，那么使用它来解决涉及推理的问题也是相当自然的，并非你所说的Opus不是玩这个领域。至于你说的排位赛的问题。因为业界必须去评判和量化模型的好坏标准的，目前无非就是基准测试——回答固定的题目记分，和排位赛——用户盲选给模型投票。我相信这两种方法是人们可以想象的去评判和量化的最好方法（具体使用的统计方法合理性你完全查询得到），这两种方法的虽然不能说能做到百分百准确，但是我相信在很大程度上能反映模型的好坏。如果你有更好的量化方案你也可以提出，但是完全说这种评判和量化是“还能干吗”的消极评论是反智的。最后，你说“不懂的人弄错了害人，给本来就懂的人看这个，我知道答案了让你再算一遍”。我也是不太认同的，因为按照我个人的经验，解决一些数学的问题，如果稍微有点难度和复杂，需要AI百分百回答正确是不太可能的。当然它的回答可能会夹杂着“幻觉”，但是这些幻觉如果出现在需要逻辑推理问题里，是可以被人所察觉的——因为幻觉产生出逻辑上的出矛。首先，找出这种幻觉(矛盾)本身就是可以令提问者对于问题有更深入的认识。其次，不百分百回答正确，这并不代表它不能提供有价值的思路和部分正确的东西。上述两点是可以辅助提问者最终得到正确的答案的。在我看来，使用AI去解决困难的问题，核心是在于它能突破自己固有的思维，尝试新的方法。而我一开始说评论说Opus不如GPT4，所表达的具体含义是GPT4相对能提供更加准确的“方向”。通过你的言论我可以推测你是没有使用AI去协助解决需要推理的复杂问题经验的。不过无论如何，你的观点只透漏出你目光短浅
【回复】回复 @1064Leung :你真别搁这高人一等的bb，我就说一句你给我脑补这么多是吧，文学创意的文笔gpt不如Claude你试试不就得了？非要搞瑟瑟？不要拿你那点心思揣测所有人
【回复】回复 @Lejeune-z :我个人猜测可能你想讲酒馆的事，可能其他人用opus搭酒馆玩见不了光的涩涩角色扮演是他们的事，并非每个人使用Ai都是为了满足自己的情欲的，请不要暗示使用Opus有“唯一最正确”的用法。官方在推出opus的时候宣传是在MATH%、MMLU等的基准测试是完爆GPT的，这代表在当时事人类能制造出最聪明的东西，我也是针对其述，按照我个人的使用经验分析下看法，是合情合理的，并无什么不妥。
GPT4Plus各种Ai充值代:
提供美国卡代充各种Ai平台，可以选择小黄鱼或某宝进行交易，需要滴滴~[给心心]

claude 亚马逊云科技 chatgpt ai agent OpenAI github ai 科技最前沿 Bedrock claude 3 opus

如果觉得我的文章对您有用，请随意打赏。您的支持将鼓励我继续创作！