Meta上新Llama 4,到底行不行?

这周AI圈被Meta的"深夜突袭"炸开了锅。

Llama 4家族带着三个新成员,直接杀回开源模型战场,连扎克伯格都亲自站台喊话:"我们要让全世界用上最好的AI!"

但别急着喊"王炸",先看看它到底强在哪。

这次Meta玩了个狠招:混合专家架构(MoE),把模型拆成一群"专业小分队",各司其职。比如Maverick模型,总参数4000亿,但每次只激活170亿------相当于用1/20的算力,干出接近GPT-4o的活儿。

说明Meta已经在liama中融入了deep seek的思想。

更绝的是多模态能力

Llama 4终于"长眼睛"了!上传一张工具图问"哪个适合修水管",它能圈出扳手;识别动漫角色也不在话下------虽然写代码还会翻车。

Llama 4系列支持多模态数据处理,可以处理文本、图像、视频等多种格式的内容。这在实际应用中非常有用,比如在内容创作、智能客服等领域,Llama 4都能发挥巨大的作用。

说到代码,网友实测结果有点分裂。

Llama 4 Maverick在竞技场榜单冲到1417分,碾压DeepSeek-V3,但面对经典"Python六边形测试",直接败下阵来。
Meta自己都承认:这货擅长聊天和推理,但代码还得再练练。

另一个杀手锏是千万级上下文窗口

Scout模型能塞下1000万token,相当于20小时视频或1.5万页书。

医学病历分析、超长代码库梳理,这些过去要切块处理的苦差事,现在能一口气搞定了。

但参数党先别嗨。

那个2万亿参数的"巨兽"Behemoth还在训练,Meta说它数学能力超GPT-4.5,可实测网友吐槽:"跑起来要3台512GB内存的Mac,成本比H100低,但速度慢24倍!"

价格倒是真香。

Maverick推理成本每百万token只要0.19美元,比GPT-4o便宜95%。

难怪谷歌CEO劈柴哥都发来贺电:"AI世界,从不平淡!"

所以回到最初的问题:Llama 4强不强?
答案很Meta:技术亮点炸裂,实战表现参差,生态野心拉满。

至于能不能坐稳"开源一哥"?等DeepSeek R2和GPT-5出招再说。

相关推荐
VI8664956I261 小时前
海外社交软件技术深潜:实时互动系统与边缘计算的极限优化
人工智能·实时互动·边缘计算
每天都要写算法(努力版)1 小时前
【神经网络与深度学习】生成模型-单位高斯分布 Generating Models-unit Gaussian distribution
人工智能·深度学习·神经网络·生成模型
何似在人间5751 小时前
LangChain4j +DeepSeek大模型应用开发——7 项目实战 创建硅谷小鹿
java·人工智能·ai·大模型开发
Timmer丿2 小时前
Spring AI开发跃迁指南(第二章:急速上手3——Advisor核心原理、源码讲解及使用实例)
java·人工智能·spring
xrgs_shz2 小时前
基于MATLAB图像中的圆形目标识别和标记
图像处理·人工智能·计算机视觉·matlab
pen-ai2 小时前
【NLP】32. Transformers (HuggingFace Pipelines 实战)
人工智能·自然语言处理
pen-ai2 小时前
【NLP】 28. 语言模型的评估方式:MRR, PERPLEXITY, BLEU, WER从困惑度到实际效果
人工智能·语言模型·自然语言处理
新加坡内哥谈技术3 小时前
谷歌最新推出的Gemini 2.5 Flash人工智能模型因其安全性能相较前代产品出现下滑
人工智能
搏博3 小时前
神经网络在专家系统中的应用:从符号逻辑到连接主义的融合创新
人工智能·深度学习·神经网络·算法·机器学习
Eric.Lee20213 小时前
数据集-目标检测系列- 印度人脸 检测数据集 indian face >> DataBall
人工智能·算法·目标检测·计算机视觉·yolo检测·印度人脸检测