Meta 刚刚发布 Llama 3.1 :在 AI 战斗中向 OpenAI 发起了大规模挑战|TodayAI

社交巨头 Facebook 母公司 Meta 公司近日发布了其 Llama 系列人工智能模型的最新版本 Llama 3.1,包括迄今为止最大的版本,容量达到 820GB。这一新版本标志着 Meta 在 AI 领域向 OpenAI 发起了大规模挑战,并宣称其用户数量将超过 ChatGPT

Meta 表示,Llama 3.1 是对整个系列的全面升级,涵盖了小型和中型版本的推理能力提升。更重要的是,这些模型仍然保持开源,任何公司或组织都可以下载、微调并在自己的硬件上运行这些模型。

公司声称,Llama 3.1 405b 是系列中最大的版本,能够与 OpenAI 和 Google 的模型匹敌,包括在推理和编码能力方面。Meta 强调,这一版本可以在 Groq Cloud 推理平台、Meta 自己的 MetaAI 聊天机器人以及 AWS、IBM 和 Azure 等开发者云平台上使用。

Llama 3.1 405b 具备 4050 亿参数,是 Meta 和开源 AI 社区的重大进展。公司声称该版本在多个关键基准测试中击败了 Claude 3.5 Sonnet 和 GPT-4o。虽然 Meta 将在自己的 MetaAI 聊天机器人中使用这一模型,但它也将为其他公司提供先进的前沿智能,使其能够根据自身需求进行调整,并且无需向 OpenAI 支付每个 token 的费用。

在训练和随后的微调过程中,Meta 特别注重聊天机器人的 "有用性"。Meta 在一份声明中表示:"通过 Llama 3.1 405B,我们努力提高模型在响应用户指令时的有用性、质量和详细指令跟随能力,同时确保高水平的安全性。" 该版本还配备了更大的 128,000 token 上下文窗口,使其大致符合行业标准。

Llama 3.1 共有三个版本。第一个是 8B,轻量且超快,可以在任何地方运行,包括智能手机上。第二个是 70B,高性能且具有成本效益,主要在数据中心运行,但也可以在高端游戏电脑上运行。最后是新的旗舰基础模型 405B,其质量和能力接近 OpenAI、Google 和 Anthropic 等大公司的大型私人模型。

Llama 3.1,包括新的 405b 版本,可以在 MetaAI 聊天机器人中使用,但该机器人的全球发布有限。更广泛地说,用户可以通过 Groq Cloud 或非常快速的 Groq 聊天机器人界面访问它。来自 Microsoft、Google、Amazon、DataBricks 等公司的其他开发者平台也正在加载新模型,如果用户有自己的数据中心,可以从 GitHub 下载所有三个版本并自行运行。

两个较小的版本 ------ 8b 和 70B ------ 可在 Ollama 上使用,这是一个适用于 Windows、Mac 和 Linux 的本地 AI 模型的易用安装程序。

Meta CEO 马克·扎克伯格预测,到今年年底,MetaAI 将成为最广泛使用的助手,超越 ChatGPT 成为访问 AI 的首选方式。他表示,这将归功于通过 WhatsApp、Instagram、Ray-Ban 智能眼镜和独立的 MetaAI 聊天机器人对助手的扩展访问。它还将用于 Quest 混合现实头显,以取代当前的语音命令。

相关推荐
用户51914958484539 分钟前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户0183493016944 分钟前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气4 小时前
Function Calling 格式漂移
人工智能
onething3654 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
onething3655 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 6 —— 业务完善 + 会话消息预览
人工智能·后端·全栈
IT_陈寒5 小时前
SpringBoot自动配置的坑,我爬了三天才出来
前端·人工智能·后端
甲维斯7 小时前
笑抽了!DeepSeek识图,豆包完胜了!
人工智能·deepseek
Lei活在当下15 小时前
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南
人工智能·llm·openai
冬奇Lab16 小时前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
冬奇Lab17 小时前
Agent 系列(22):Context Engineering 深度——三种上下文管理策略的量化对比
人工智能·agent