LLaMA模型泄露 Meta成最大受益者

一份被意外泄露的谷歌内部文件,将Meta的LLaMA大模型"非故意开源"事件再次推到大众面前。"泄密文件"的作者据悉是谷歌内部的一位研究员,他大胆指出,开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河,而最大的受益者是Meta,因为该公司2月意外泄露的LLaMA模型,正在成为开源社区训练AI新模型的基础。

几周内,开发者与研究人员基于LLaMA搞起微调训练,接连发布了Alpaca、Vicuna、Dromedary等中小模型,不只训练成本仅需几百美元,硬件门槛也降低至一台笔记本电脑甚至一部手机,测试结果不比GPT-4差。除了AI模型之外,FreedomGPT等类ChatGPT应用也如雨后春笋般涌现,基于LLaMa的"羊驼家族"不断壮大,这位研究员认为,Meta很可能借此形成生态,从而成为最大赢家。事实上,人工智能的世界里,的确有一部分进入了"安卓时刻",这个部分就是开源社区。

ChatGPT引爆AI热后,英伟达的CEO黄仁勋将这股浪潮喻为"AI的iPhone时刻",他认为,AI行业进入了如iPhone诞生颠覆手机行业时的革命性时间点。而当LLaMA开启开源社区的小宇宙后,网友认为,"AI的安卓时刻"来了。 回顾过去,谷歌曾以开源思想让更多的开发者参与到安卓应用生态的建设中,最终让安卓成为电脑与手机的系统/应用主流。如今,LLaMA再次让AI业内看到了开源力量的强大。

特斯拉前AI主管Andrej Karpathy认为:"当前开源大模型的生态之势,已经有了寒武纪大爆发的早期迹象。"确实,开发者对开源的AI模型前所未有的热情正在从Github的打星量指标中溢出:Alpaca获得了23.2k星,llama.cpp获26.3k星,LLaMA获20.8k星......而在"羊驼家族"之前,AutoGPT等开源项目也在Github拥有超高的人气,突破100k星。

此外,为了追赶 ChatGPT,构建大型开源社区的 AI 初创公司Hugging Face 也在近日推出了开源聊天机器人HuggingChat,该机器人的底层模型拥有300 亿个参数,并对外开放了训练数据集。英伟达 AI 科学家 Jim Fan认为,如果后续开发应用程序,Hugging Face将比 OpenAI 更具优势。

开源力量来势汹汹。在不久前的微软Inspire合作伙伴大会上,Meta方面宣布将与包括微软在内的主要云计算服务提供商合作,正式推出新一代开源大模型Llama 2,并将该模型免费开放给商业和研究机构使用。如今回过头来看,Llama的泄露很有可能是Meta有意而为之,并借此来试探社区对于开源大模型的态度,而在得到了社区身体力行的支持后,Llama 2也就很快诞生了。

相关素材整理于《大模型遭泄两月后 Meta意外变赢家》一文

相关推荐
大模型最新论文速读8 小时前
指令微调时,也要考虑提示损失
人工智能·深度学习·语言模型·自然语言处理·llama
liliangcsdn3 天前
在mac m1基于llama.cpp运行deepseek
人工智能·macos·语言模型·llama
强哥之神4 天前
Meta AI 推出 Multi - SpatialMLLM:借助多模态大语言模型实现多帧空间理解
人工智能·深度学习·计算机视觉·语言模型·自然语言处理·llama
try2find9 天前
安装llama-cpp-python踩坑记
开发语言·python·llama
西西弗Sisyphus9 天前
LLaMA-Factory 单卡后训练微调Qwen3完整脚本
微调·llama·llama-factory·后训练
顾道长生'9 天前
(Arxiv-2024)自回归模型优于扩散:Llama用于可扩展的图像生成
计算机视觉·数据挖掘·llama·自回归模型·多模态生成与理解
Zhijun.li@Studio19 天前
【LLaMA-Factory 实战系列】二、WebUI 篇 - Qwen2.5-VL 多模态模型 LoRA 微调保姆级教程
人工智能·自然语言处理·llama·多模态大模型
1213419 天前
LLM:重构数字世界的“智能操作系统”
gpt·aigc·ai编程·llama·gpu算力
冷雨夜中漫步1 个月前
Java中如何使用lambda表达式分类groupby
java·开发语言·windows·llama
扫地的小何尚1 个月前
全新NVIDIA Llama Nemotron Nano视觉语言模型在OCR基准测试中准确率夺冠
c++·人工智能·语言模型·机器人·ocr·llama·gpu