新火种AI|微软扶持下一个OpenAI?Mistral AI新模型对标GPT-4,上线即挤爆

作者:一号

编辑:美美

OpenAI的大金主微软,还想缔造"下一个OpenAI"。

周一晚间,成立仅9个月的Mistral AI正式发布了最强力的旗舰模型Mistral Large。和此前他们所推出的一系列模型不同,Mistral AI本次发布的版本性能更强,体量也更大,直接对标OpenAI的GPT-4。

在目前所有能够通过API访问的大模型中,Mistral Large排名第二,仅次于"当红明星"GPT-4,并且和GPT-4一样,是唯二在MMLU考试中拿到了80分以上的。

而且随着Mistral Large上线,Mistral AI还推出了名为Le Chat的聊天机器人,对标ChatGPT,大有复制OpenAI成功道路的意图。即便有微软Azure算力资源的加持,Le Chat的服务器还是被挤爆了。

忘了初心,开源变闭源?

早在本次Mistral Large"炸街"之前,Mistral AI所提出的Mistral-Medium就因为其强大的性能,还有令人意外的开源而名噪一时。使得不少的大模型初创企业不再对标Llama2这个开源模型,而是转而将Mistral旗下的模型作为直接竞争对手。这一次Mistral Large的横空出世,自然引人注目。

从性能上来说,尽管Mistral Large在参数量上还比不上GPT-4,但在一些关键性能上,它还是能够和GPT-4一战的,可以说,已经是当前业内前三的地位。

在推理准确性上,Mistral Large也已经超过了Claude 2、Gemini 1.0 Pro、GPT-3.5等一众为人所熟知的大模型,并且它还支持32k token的上下文窗口,支持精确指令,自带函数调用能力。在推理速度上,Mistral Large甚至还超过了GPT-4还有谷歌刚推出不久的Gemini Pro。

但有眼尖的网友发现,Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这让不少开源大模型爱好者开始担心,Mistral AI也会像OpenAI一样,从开放走向封闭。

不过据媒体对Mistral CEO的采访,未来他们依旧会坚持开源理念,但与此同时,也会推出性能最为强大的闭源模型来参与商业竞争。

从诞生之初,就充满传奇光环

谁能想到,今天这个逼近GPT-4的模型,是来自一家仅仅成立9个月的法国公司。

Mistral AI的创始人Arthur Mensch在1993年时出生于法国。在巴黎综合理工学院和巴黎高等师范学院学习期间,他结识了后来成为Mistral AI联合创始人的Timothée Lacroix和Guillaume Lample。而后两位都曾在Meta AI团队工作过,其中Lample还领导了LLaMA模型的开发。在那时,全球范围内具备构建、训练和优化大型语言模型(LLM)专业经验的人才不超过100人。

Arthur Mensch本人也颇有实力。他在2020年初便加入了谷歌,成为了DeepMind的研究员,专注于提高AI和机器学习系统的效率。在那里,他参与开发了大型语言模型,并以主要作者的身份发表了著名的"Chinchilla论文",该研究重新定义了人们对AI模型大小、训练数据量及其性能之间关系的认识。

然而随着AI竞赛的升温,Mensch对于大公司AI实验室减少与研究社区分享研究成果的做法感到失望。他所在的团队从一个10人的小团队迅速扩大到70人的大团队,但他觉得在大型科技公司中开发不透明的技术过于官僚化,于是决定离开。

2023年初,他离开了谷歌,和前文所提到的Lacroix和Lample一起创立了Mistral AI。他们的目标是通过更加高效的方法构建和部署AI模型,并坚持开源模型的原则,希望让每个人对自己使用的AI有更多的控制权。

在种子轮融资时,Mistral AI的故事更具传奇色彩:一个6人团队凭借着7页PPT就拿到了8亿欧元的融资。而当前公司的估值已经达到了20亿美元,涨了七倍多。尽管与美国的竞争者相比,所获得的资金并不算多,但他们的目标是成为AI领域中最节省资本的公司。

微软想要打造下一个OpenAI?

在Mistral Large以令人惊喜的性能收获目光之时,微软CEO纳德拉宣布,微软已经和Mistral AI建立了多年合作伙伴关系。这也是微软继OpenAI之后,又再一次地把"真金白银"投给了AI圈的另一家顶流模型公司。

人们不禁怀疑,微软这是想要打造"下一个OpenAI"?

根据公告,微软和Mistral AI的合作将集中在以下三个关键领域:

超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。

扩展市场:微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务(MaaS)向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外,模型目录还提供了多种开源和商业模型。

人工智能研发:微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。

毫无疑问,除了OpenAI之外,微软还想给自己的Azure云服务吸引更多客户。并且,微软两头下注,实际上很可能是想要分散风险,并且期望获得更大的影响力。

去年11月,OpenAI经历了CEO奥特曼被解雇而后又重返的董事会风波。而作为OpenAI的最大股东,微软直到消息公布之前的5到10分钟才从OpenAI那里得到消息。尽管在这场风波之后,微软设法在控制 OpenAI 的非营利性董事会中获得了一个无投票权的观察员席位,这让他们对OpenAI的内部运作有了更多的了解,但在一些重大决策上,微软依旧没有投票权。

微软作为OpenAI的最大金主,**显然没在OpenAI的决策上取得与之相对应的影响力。**因此,微软想要扶持另一家能够与OpenAI对位的企业也是情理之中。

这一点,在路透社对Mistral AI的采访中也得到了体现,Mistral AI承认,作为交易的一部分,微软将持有该公司少数股权,但并没有透露更多细节。而微软这边则仅仅是证实了其对Mistral的投资,在是否持有该公司股权的问题上,微软给出了否定的回答。而这很可能与微软因向OpenAI提供了巨额资金而受到欧洲和美国监管机构的审查有关。

另外,由于Mistral AI是一家法国公司,在语言支持上也更加偏向于欧洲本土语言,因此微软投资Mistral AI也是想要在欧洲建立起自己的AI影响力,在欧洲AI领域站稳脚跟。

与美国不同,欧洲许多国家对AI的态度偏保守,持批判性看法,尤其是数据保护方面。因此投资一家欧洲本土的AI企业,打造一家"欧洲版OpenAI",也许能够更让人放心。

相关推荐
陈苏同学26 分钟前
MPC控制器从入门到进阶(小车动态避障变道仿真 - Python)
人工智能·python·机器学习·数学建模·机器人·自动驾驶
努力毕业的小土博^_^1 小时前
【深度学习|学习笔记】 Generalized additive model广义可加模型(GAM)详解,附代码
人工智能·笔记·深度学习·神经网络·学习
小小鱼儿小小林1 小时前
用AI制作黑神话悟空质感教程,3D西游记裸眼效果,西游人物跳出书本
人工智能·3d·ai画图
浪淘沙jkp1 小时前
AI大模型学习二十、利用Dify+deepseekR1 使用知识库搭建初中英语学习智能客服机器人
人工智能·llm·embedding·agent·知识库·dify·deepseek
AndrewHZ3 小时前
【图像处理基石】什么是油画感?
图像处理·人工智能·算法·图像压缩·视频处理·超分辨率·去噪算法
Robot2514 小时前
「华为」人形机器人赛道投资首秀!
大数据·人工智能·科技·microsoft·华为·机器人
J先生x4 小时前
【IP101】图像处理进阶:从直方图均衡化到伽马变换,全面掌握图像增强技术
图像处理·人工智能·学习·算法·计算机视觉
Narutolxy7 小时前
大模型数据分析破局之路20250512
人工智能·chatgpt·数据分析
浊酒南街7 小时前
TensorFlow中数据集的创建
人工智能·tensorflow
2301_787552878 小时前
console-chat-gpt开源程序是用于 AI Chat API 的 Python CLI
人工智能·python·gpt·开源·自动化