Mistral AI,成功完成了一轮高达 4.15 亿美元的资金募集。

法国新兴企业 Mistral AI 刚刚完成了备受瞩目的 A 轮融资。公司成功筹集了 3.85 亿欧元,折合当前汇率约为 4.15 亿美元。据 Bloomberg 报道,这一举措将公司估值推至大约 20 亿美元。今天,Mistral AI 也正式向外界开放其商业化平台。

回顾一下,Mistral AI 在不足六个月前就已经完成了 1.12 亿美元的种子轮融资,旨在打造一个能与 OpenAI 竞争的欧洲对手。Mistral AI 由来自谷歌 DeepMind 和 Meta 的前员工共同创立,专注于开发带有开放技术理念的基础模型。

最新一轮融资由 Andreessen Horowitz (a16z) 领投,Lightspeed Venture Partners 再次对这家 AI 企业进行了投资。此外,还有一长串的投资者加入了这一轮融资,包括 Salesforce、BNP Paribas、CMA-CGM、General Catalyst、Elad Gil 和 Conviction。

Mistral AI 的联合创始人兼 CEO Arthur Mensch 在一份声明中表示:"自 Mistral AI 今年 5 月成立以来,我们始终坚持明确的方向:打造一个基于开放、负责任和去中心化技术方法的、具有全球视野的欧洲领军企业。"

9月,Mistral AI 推出了其首个模型 Mistral 7B。这个大语言模型并非旨在与 GPT-4 或 Claude 2 直接竞争,因为它只训练了大约 70 亿 Token 的"较小"数据集。

公司选择不通过 API 提供 Mistral 7B 模型的访问,而是允许人们免费下载,开发者可以在自己的设备和服务器上运行。该模型基于 Apache 2.0 许可发布,这是一种开源许可证,除了要求署名外,没有其他使用或复制的限制。尽管任何人都可以运行这个模型,但它是在闭门造车的情况下,使用专有的且未公开的数据集开发出来的。

Mistral AI 在塑造关于欧盟 AI 法案的讨论中也扮演了重要角色。这家法国 AI 初创公司一直在游说,争取基础模型的完全豁免,认为法规应当针对最终用户直接使用的产品和公司的具体应用场景。

欧盟立法者最近达成了一项政治协议。从事基础模型研发的公司将需要满足一定的透明度要求,并且必须公开技术文档以及数据集内容的概要。

Mistral AI 最优秀的模型现在只能通过 API 获取

Mistral AI 仍然计划通过其基础模型来实现盈利。因此,公司今天推出了其开发者平台的测试版。通过这个平台,其他公司可以付费通过 API 使用 Mistral AI 的模型。

除了 Mistral 7B 模型(又称"Mistral-tiny"),开发者还可以接触到全新的 Mixtral 8x7B 模型(即"Mistral-small")。这款模型利用了"路由网络"技术,能够处理输入的 Token 并选择最合适的参数群组来响应查询。

"这种技术提升了模型的参数总量,同时控制了成本和响应时间,因为模型对每个 Token 只使用了全部参数中的一小部分。具体来说,Mixtral 拥有 450 亿的参数总量,但每个 Token 只用到了 120 亿参数。因此,它在处理输入和输出时,无论是速度还是成本,都与 120 亿参数的模型相当,"公司在一篇博客文章中解释道。

Mixtral 8x7B 也采用 Apache 2.0 许可发布,并提供免费下载。另一个模型,Mistral-medium,可以在 Mistral 的开发者平台上找到。据称,它的性能超过了 Mistral AI 的其他模型,但它仅通过付费的 API 平台提供---没有下载选项。

相关推荐
IT猿手2 分钟前
超多目标优化:基于导航变量的多目标粒子群优化算法(NMOPSO)的无人机三维路径规划,MATLAB代码
人工智能·算法·机器学习·matlab·无人机
JolyouLu12 分钟前
PyTorch-基础(CUDA、Dataset、transforms、卷积神经网络、VGG16)
人工智能·pytorch·cnn
CS_木成河16 分钟前
【深度学习】预训练和微调概述
人工智能·深度学习·语言模型·微调·预训练
新加坡内哥谈技术24 分钟前
微软发布Majorana 1芯片,开启量子计算新路径
人工智能·深度学习·语言模型·自然语言处理
真智AI1 小时前
使用 DistilBERT 进行资源高效的自然语言处理
人工智能·自然语言处理
OpenBuild.xyz1 小时前
我是如何从 0 到 1 找到 Web3 工作的?
人工智能·web3·去中心化·区块链·智能合约
Sui_Network1 小时前
Sui 如何支持各种类型的 Web3 游戏
大数据·数据库·人工智能·游戏·web3·区块链
ZKNOW甄知科技1 小时前
IT服务运营管理体系的常用方法论与实践指南(上)
大数据·数据库·人工智能
Luke Ewin1 小时前
根据音频中的不同讲述人声音进行分离音频 | 基于ai的说话人声音分离项目
人工智能·python·音视频·语音识别·声纹识别·asr·3d-speaker
終不似少年遊*2 小时前
循环神经网络RNN原理与优化
人工智能·rnn·深度学习·神经网络·lstm