随着大型语言模型 (LLM) 的出现,ChatGPT迅速成为全球计算机用户的家喻户晓的名字。这款由 OpenAI 设计的深度学习聊天机器人以知识宝库而闻名------一部互联网百科全书。
继ChatGPT的脚步之后,许多其他生成式AI工具也纷纷涌现。
2023 年 3 月,一款名为Claude AI 的新工具发布,并与其他竞争对手相比表现出色。其新版本 Claude 3 和 3.5 于今年发布,与现任王者 ChatGPT 展开激烈竞争。
是什么让 Claude AI 如此特别?
Claude 是 OpenAI 前员工创建的组织 Anthropic 的创始人。难怪 ChatGPT 的最初开发者能够在构建新模型方面超越自己。
在使用 ChatGPT 作为数字助理一段时间后,我最近遇到了 Claude,发现它出奇的直观,这促使我写了这篇文章。
测试 ChatGPT 与 Claude
没有比通过实际测试来评估工具性能更好的方法了。
我使用相同的提示测试了 ChatGPT 和 Claude 的免费版本,并比较了它们的结果。
以下是我使用这两种工具尝试进行的一些活动:
- 进行类似人类的对话。
- 写一篇有创意的短篇小说。
- 在特定领域产生主题思想。
- 知识更新。
测试 #1。像人类一样的对话 --- 谁能做到?
我向这些工具介绍了工作中遇到的困难个人情况,并征求他们的建议。请注意,我促使这些工具像"亲密朋友"一样与我交谈。
提示:我在工作中遇到了一个问题,我的同事非常难相处,总是贬低每个人。请提出解决这个问题的最佳方法。像亲密朋友一样给我建议,我不需要外交或政治正确的答案。
作者截图 - ChatGPT(左)和 Claude(右)的回应
- ChatGPT 给了我很好的解决方案------我会为非个人博客文章起草的常识性建议。
- 然而,Claude 绝对做到了。它完全按照我的提示说话,就像一个亲密的朋友一样。不仅仅是因为脏话,还因为谈话中自然的气氛。
克劳德在自然语言测试和类似人类的坦率测试中明显胜出。
测试 #2。创造力 --- 写一篇关于爱情的短篇故事
这是我创作短篇小说的提示。
提示:写一篇 300 字的爱情短篇小说,主题是"爱情战胜一切"。使用人性化的语言,在结尾处添加一个美丽的转折,不要使用法学硕士过度使用的词语。
作者截图 - ChatGPT 故事
截图来自作者------Claude Story
- ChatGPT 的主题直接借鉴了好莱坞------爱情如何战胜记忆丧失。还记得亚当·桑德勒和德鲁·巴里摩尔主演的电影《初恋50次》吗?
- 《克劳德》在创意指标上表现稍好一些。它引入了一场自然灾害让一对恋人走到一起,略显有趣,因为它有一些实际的动作。
好吧,这只是一个短篇故事,人们不应该对人工智能工具抱有太大的期望。但 ChatGPT 的故事对我来说太过浮夸。如果我必须选择其中一种工具作为创意任务的数字助理,Claude 似乎更合适一些。
测试 #3。创意生成 --- 关于心理健康的话题
这是我对主题想法的简单提示。
提示:你好,我正在寻找有关心理健康的主题和想法,请给我10个你能想到的有趣且极其有趣的主题。
作者截图 - ChatGPT 主题创意
截图来自作者-Claude话题想法
- ChatGPT 在主题方面做得相当不错,但有些笼统。数字排毒、睡眠的力量和孤独都是相当标准的话题。
- 另一方面,克劳德提出了一些有趣的想法,例如清醒梦、森林浴和神经可塑性。
- 这两种工具也有重叠的主题------虚拟现实用于治疗创伤后应激障碍 (PTSD)。
总体而言,您可以看到 Claude 在提出独特想法方面比 ChatGPT 做得更好。它比 ChatGPT 更准确地遵循了我提出的"有趣"的提示。
测试 #4. 试金石 --- 知识更新
我询问了这两个工具的上次更新时间。
提示:您对世界各地的时事和事件信息了解多少?
作者截图 - ChatGPT
截图来自作者 Claude
- ChatGPT 上一次训练是在 2023 年 10 月,比现在晚了 10 个月。
- Claude 上次更新是在 2024 年 4 月,晚了 4 个月,因此它的信息更为丰富。
克劳德还试图解释说,它愿意像其他人一样讨论最新事件。这是一个很好的举动。
Claude 获胜
在上述所有测试的方面中,最让我印象深刻的是 Claude 进行类似人类的对话的能力。
我还尝试了 ChatGPT 和 Claude 的各种其他功能。到目前为止,Claude 似乎在各个方面都胜过 ChatGPT。
我很期待 ChatGPT 能否提供更好的自然语言处理功能。付费版本应该更高效。然而,大多数用户和我一样倾向于使用免费版本。
ChatGPT 确实需要提升自己的水平才能保持竞争力。否则,Claude 等新工具很快就会将其远远甩在身后。