测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus

测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus

  • [0. 引言](#0. 引言)
  • [1. 测试 Claude 3 Opus](#1. 测试 Claude 3 Opus)

0. 引言

今天测试一下 Anthropic 发布的 Claude 3 Opus。

3月4日,Anthropic 宣布推出 Claude 3 型号系列,该系列在广泛的认知任务中树立了新的行业基准。该系列包括三款最先进的型号,按功能升序排列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。每个后续型号都提供越来越强大的性能,允许用户为其特定应用选择智能、速度和成本的最佳平衡。

Opus 和 Sonnet 现在可以在 claude.ai 和 Claude API 中使用,后者现已在 159 个国家/地区正式发布。

Claude 3 模型系列


以下是 Claude 3 型号与同行在多个性能基准 [1] 上的比较

强大的视觉能力

Claude 3 型号具有与其他领先型号相媲美的复杂视觉功能。它们可以处理各种视觉格式,包括照片、图表、图形和技术图表。我们特别高兴能为我们的企业客户提供这种新模式,其中一些客户拥有多达 50% 的知识库以各种格式编码,例如 PDF、流程图或演示幻灯片。

refer: https://www.anthropic.com/news/claude-3-family

1. 测试 Claude 3 Opus

题目是我之前写的 让 OpenAI GPT4 出 10 道题测试其他开源大语言模型

无图无真相,直接上截图,这样大家也可以自行判断一下效果。

import anthropic

client = anthropic.Anthropic(
    # defaults to os.environ.get("ANTHROPIC_API_KEY")
    # api_key="my_api_key",
)

def chat(content):
    return client.messages.create(
        model="claude-3-opus-20240229",
        max_tokens=1000,
        temperature=0,
        messages=[
            {"role": "user", "content": content}
        ]
    )

response = chat("<your question>")
print(response.content[0].text)
  1. 一个矩形的长是10厘米,宽是5厘米,求它的面积。
  2. 中国的四大发明是什么?
  3. 世界上最高的山是什么?
  4. 牛顿第二运动定律是什么?
  5. 水的化学式是什么?
  6. DNA的全称是什么?
  7. 《红楼梦》的作者是谁?
  8. 太阳系中最大的行星是哪一个?
  9. 乒乓球起源于哪个国家?
  10. 世界上第一台电脑是什么?

    完结!
相关推荐
知来者逆1 个月前
GPT-4、Claude 3 Opus 和 Gemini 1.0 Ultra 挑战控制工程的新领域
人工智能·gpt·ai作画·gpt-4·gemini·claude 3
R-QWERT2 个月前
音频demo:将PCM数据和opus格式相互编解码
音视频·pcm·opus
DataPipe3 个月前
ChatGPT Plus GPT-4o Claude 3 Opus合租拼车全新方式
人工智能·chatgpt·claude3
ATalk机器人4 个月前
claude3国内API接口对接
api·fastapi·oneapi·claude3
自足4 个月前
claude3国内API接口对接
chatgpt·gpt4·claude3
慢腾腾的小蜗牛6 个月前
ChatGPT GPT4科研应用、数据分析与机器学习、论文高效写作、AI绘图技术
人工智能·机器学习·chatgpt·数据挖掘·数据分析·sora·claude3
慢腾腾的小蜗牛6 个月前
最新ChatGPT/GPT4科研应用与AI绘图及论文高效写作
人工智能·深度学习·机器学习·chatgpt·pika·sora·claude3
AIzmjl6 个月前
Claude3、Gemini、Sora VS GPT-4:AI技术如何助力科研与产业发展?
人工智能·python·gpt·gpts·gemini·sora·claude3
zmjia1116 个月前
GPT-4技术解析:与Claude3、Gemini、Sora的技术差异与优势对比
python·深度学习·机器学习·chatgpt·gemini·sora·claude3