LLaMA模型泄露 Meta成最大受益者

一份被意外泄露的谷歌内部文件,将Meta的LLaMA大模型"非故意开源"事件再次推到大众面前。"泄密文件"的作者据悉是谷歌内部的一位研究员,他大胆指出,开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河,而最大的受益者是Meta,因为该公司2月意外泄露的LLaMA模型,正在成为开源社区训练AI新模型的基础。

几周内,开发者与研究人员基于LLaMA搞起微调训练,接连发布了Alpaca、Vicuna、Dromedary等中小模型,不只训练成本仅需几百美元,硬件门槛也降低至一台笔记本电脑甚至一部手机,测试结果不比GPT-4差。除了AI模型之外,FreedomGPT等类ChatGPT应用也如雨后春笋般涌现,基于LLaMa的"羊驼家族"不断壮大,这位研究员认为,Meta很可能借此形成生态,从而成为最大赢家。事实上,人工智能的世界里,的确有一部分进入了"安卓时刻",这个部分就是开源社区。

ChatGPT引爆AI热后,英伟达的CEO黄仁勋将这股浪潮喻为"AI的iPhone时刻",他认为,AI行业进入了如iPhone诞生颠覆手机行业时的革命性时间点。而当LLaMA开启开源社区的小宇宙后,网友认为,"AI的安卓时刻"来了。 回顾过去,谷歌曾以开源思想让更多的开发者参与到安卓应用生态的建设中,最终让安卓成为电脑与手机的系统/应用主流。如今,LLaMA再次让AI业内看到了开源力量的强大。

特斯拉前AI主管Andrej Karpathy认为:"当前开源大模型的生态之势,已经有了寒武纪大爆发的早期迹象。"确实,开发者对开源的AI模型前所未有的热情正在从Github的打星量指标中溢出:Alpaca获得了23.2k星,llama.cpp获26.3k星,LLaMA获20.8k星......而在"羊驼家族"之前,AutoGPT等开源项目也在Github拥有超高的人气,突破100k星。

此外,为了追赶 ChatGPT,构建大型开源社区的 AI 初创公司Hugging Face 也在近日推出了开源聊天机器人HuggingChat,该机器人的底层模型拥有300 亿个参数,并对外开放了训练数据集。英伟达 AI 科学家 Jim Fan认为,如果后续开发应用程序,Hugging Face将比 OpenAI 更具优势。

开源力量来势汹汹。在不久前的微软Inspire合作伙伴大会上,Meta方面宣布将与包括微软在内的主要云计算服务提供商合作,正式推出新一代开源大模型Llama 2,并将该模型免费开放给商业和研究机构使用。如今回过头来看,Llama的泄露很有可能是Meta有意而为之,并借此来试探社区对于开源大模型的态度,而在得到了社区身体力行的支持后,Llama 2也就很快诞生了。

相关素材整理于《大模型遭泄两月后 Meta意外变赢家》一文

相关推荐
三千院本院5 小时前
LlaMA_Factory实战微调Qwen-LLM大模型
人工智能·python·深度学习·llama
珊珊而川5 小时前
MAC-SQL:SQL-Llama 的具体训练流程
sql·macos·llama
共绩算力13 小时前
Llama 4 Maverick Scout 多模态MoE新里程碑
人工智能·llama·共绩算力
yanzhilv2 天前
Ollama + Open WebUI
llama
喜欢吃豆3 天前
掌握本地化大语言模型部署:llama.cpp 工作流与 GGUF 转换内核全面技术指南
人工智能·语言模型·架构·大模型·llama·llama.cpp·gguf
illuspas5 天前
Ubuntu 24.04下编译支持ROCm加速的llama.cpp
linux·ubuntu·llama
缘友一世8 天前
LLama3架构原理浅浅学学
人工智能·自然语言处理·nlp·transformer·llama
我们没有完整的家9 天前
批量吞吐量实测:Llama-2-7b 昇腾 NPU 六大场景数据报告
llama
asfdsfgas9 天前
从加载到推理:Llama-2-7b 昇腾 NPU 全流程性能基准
人工智能·llama
asdfsdgss9 天前
FP16 vs INT8:Llama-2-7b 昇腾 NPU 精度性能基准报告
llama