LLaMA模型泄露 Meta成最大受益者

一份被意外泄露的谷歌内部文件，将Meta的LLaMA大模型"非故意开源"事件再次推到大众面前。"泄密文件"的作者据悉是谷歌内部的一位研究员，他大胆指出，开源力量正在填平OpenAI与谷歌等大模型巨头们数年来筑起的护城河，而最大的受益者是Meta，因为该公司2月意外泄露的LLaMA模型，正在成为开源社区训练AI新模型的基础。

几周内，开发者与研究人员基于LLaMA搞起微调训练，接连发布了Alpaca、Vicuna、Dromedary等中小模型，不只训练成本仅需几百美元，硬件门槛也降低至一台笔记本电脑甚至一部手机，测试结果不比GPT-4差。除了AI模型之外，FreedomGPT等类ChatGPT应用也如雨后春笋般涌现，基于LLaMa的"羊驼家族"不断壮大，这位研究员认为，Meta很可能借此形成生态，从而成为最大赢家。事实上，人工智能的世界里，的确有一部分进入了"安卓时刻"，这个部分就是开源社区。

ChatGPT引爆AI热后，英伟达的CEO黄仁勋将这股浪潮喻为"AI的iPhone时刻"，他认为，AI行业进入了如iPhone诞生颠覆手机行业时的革命性时间点。而当LLaMA开启开源社区的小宇宙后，网友认为，"AI的安卓时刻"来了。回顾过去，谷歌曾以开源思想让更多的开发者参与到安卓应用生态的建设中，最终让安卓成为电脑与手机的系统/应用主流。如今，LLaMA再次让AI业内看到了开源力量的强大。

特斯拉前AI主管Andrej Karpathy认为："当前开源大模型的生态之势，已经有了寒武纪大爆发的早期迹象。"确实，开发者对开源的AI模型前所未有的热情正在从Github的打星量指标中溢出：Alpaca获得了23.2k星，llama.cpp获26.3k星，LLaMA获20.8k星......而在"羊驼家族"之前，AutoGPT等开源项目也在Github拥有超高的人气，突破100k星。

此外，为了追赶 ChatGPT，构建大型开源社区的 AI 初创公司Hugging Face 也在近日推出了开源聊天机器人HuggingChat，该机器人的底层模型拥有300 亿个参数，并对外开放了训练数据集。英伟达 AI 科学家 Jim Fan认为，如果后续开发应用程序，Hugging Face将比 OpenAI 更具优势。

开源力量来势汹汹。在不久前的微软Inspire合作伙伴大会上，Meta方面宣布将与包括微软在内的主要云计算服务提供商合作，正式推出新一代开源大模型Llama 2，并将该模型免费开放给商业和研究机构使用。如今回过头来看，Llama的泄露很有可能是Meta有意而为之，并借此来试探社区对于开源大模型的态度，而在得到了社区身体力行的支持后，Llama 2也就很快诞生了。

相关素材整理于《大模型遭泄两月后 Meta意外变赢家》一文