社交巨头 Facebook 母公司 Meta 公司近日发布了其 Llama 系列人工智能模型的最新版本 Llama 3.1,包括迄今为止最大的版本,容量达到 820GB。这一新版本标志着 Meta 在 AI 领域向 OpenAI 发起了大规模挑战,并宣称其用户数量将超过 ChatGPT。
Meta 表示,Llama 3.1 是对整个系列的全面升级,涵盖了小型和中型版本的推理能力提升。更重要的是,这些模型仍然保持开源,任何公司或组织都可以下载、微调并在自己的硬件上运行这些模型。
公司声称,Llama 3.1 405b 是系列中最大的版本,能够与 OpenAI 和 Google 的模型匹敌,包括在推理和编码能力方面。Meta 强调,这一版本可以在 Groq Cloud 推理平台、Meta 自己的 MetaAI 聊天机器人以及 AWS、IBM 和 Azure 等开发者云平台上使用。
Llama 3.1 405b 具备 4050 亿参数,是 Meta 和开源 AI 社区的重大进展。公司声称该版本在多个关键基准测试中击败了 Claude 3.5 Sonnet 和 GPT-4o。虽然 Meta 将在自己的 MetaAI 聊天机器人中使用这一模型,但它也将为其他公司提供先进的前沿智能,使其能够根据自身需求进行调整,并且无需向 OpenAI 支付每个 token 的费用。
在训练和随后的微调过程中,Meta 特别注重聊天机器人的 "有用性"。Meta 在一份声明中表示:"通过 Llama 3.1 405B,我们努力提高模型在响应用户指令时的有用性、质量和详细指令跟随能力,同时确保高水平的安全性。" 该版本还配备了更大的 128,000 token 上下文窗口,使其大致符合行业标准。
Llama 3.1 共有三个版本。第一个是 8B,轻量且超快,可以在任何地方运行,包括智能手机上。第二个是 70B,高性能且具有成本效益,主要在数据中心运行,但也可以在高端游戏电脑上运行。最后是新的旗舰基础模型 405B,其质量和能力接近 OpenAI、Google 和 Anthropic 等大公司的大型私人模型。
Llama 3.1,包括新的 405b 版本,可以在 MetaAI 聊天机器人中使用,但该机器人的全球发布有限。更广泛地说,用户可以通过 Groq Cloud 或非常快速的 Groq 聊天机器人界面访问它。来自 Microsoft、Google、Amazon、DataBricks 等公司的其他开发者平台也正在加载新模型,如果用户有自己的数据中心,可以从 GitHub 下载所有三个版本并自行运行。
两个较小的版本 ------ 8b 和 70B ------ 可在 Ollama 上使用,这是一个适用于 Windows、Mac 和 Linux 的本地 AI 模型的易用安装程序。
Meta CEO 马克·扎克伯格预测,到今年年底,MetaAI 将成为最广泛使用的助手,超越 ChatGPT 成为访问 AI 的首选方式。他表示,这将归功于通过 WhatsApp、Instagram、Ray-Ban 智能眼镜和独立的 MetaAI 聊天机器人对助手的扩展访问。它还将用于 Quest 混合现实头显,以取代当前的语音命令。