Mistral AI,成功完成了一轮高达 4.15 亿美元的资金募集。

法国新兴企业 Mistral AI 刚刚完成了备受瞩目的 A 轮融资。公司成功筹集了 3.85 亿欧元,折合当前汇率约为 4.15 亿美元。据 Bloomberg 报道,这一举措将公司估值推至大约 20 亿美元。今天,Mistral AI 也正式向外界开放其商业化平台。

回顾一下,Mistral AI 在不足六个月前就已经完成了 1.12 亿美元的种子轮融资,旨在打造一个能与 OpenAI 竞争的欧洲对手。Mistral AI 由来自谷歌 DeepMind 和 Meta 的前员工共同创立,专注于开发带有开放技术理念的基础模型。

最新一轮融资由 Andreessen Horowitz (a16z) 领投,Lightspeed Venture Partners 再次对这家 AI 企业进行了投资。此外,还有一长串的投资者加入了这一轮融资,包括 Salesforce、BNP Paribas、CMA-CGM、General Catalyst、Elad Gil 和 Conviction。

Mistral AI 的联合创始人兼 CEO Arthur Mensch 在一份声明中表示:"自 Mistral AI 今年 5 月成立以来,我们始终坚持明确的方向:打造一个基于开放、负责任和去中心化技术方法的、具有全球视野的欧洲领军企业。"

9月,Mistral AI 推出了其首个模型 Mistral 7B。这个大语言模型并非旨在与 GPT-4 或 Claude 2 直接竞争,因为它只训练了大约 70 亿 Token 的"较小"数据集。

公司选择不通过 API 提供 Mistral 7B 模型的访问,而是允许人们免费下载,开发者可以在自己的设备和服务器上运行。该模型基于 Apache 2.0 许可发布,这是一种开源许可证,除了要求署名外,没有其他使用或复制的限制。尽管任何人都可以运行这个模型,但它是在闭门造车的情况下,使用专有的且未公开的数据集开发出来的。

Mistral AI 在塑造关于欧盟 AI 法案的讨论中也扮演了重要角色。这家法国 AI 初创公司一直在游说,争取基础模型的完全豁免,认为法规应当针对最终用户直接使用的产品和公司的具体应用场景。

欧盟立法者最近达成了一项政治协议。从事基础模型研发的公司将需要满足一定的透明度要求,并且必须公开技术文档以及数据集内容的概要。

Mistral AI 最优秀的模型现在只能通过 API 获取

Mistral AI 仍然计划通过其基础模型来实现盈利。因此,公司今天推出了其开发者平台的测试版。通过这个平台,其他公司可以付费通过 API 使用 Mistral AI 的模型。

除了 Mistral 7B 模型(又称"Mistral-tiny"),开发者还可以接触到全新的 Mixtral 8x7B 模型(即"Mistral-small")。这款模型利用了"路由网络"技术,能够处理输入的 Token 并选择最合适的参数群组来响应查询。

"这种技术提升了模型的参数总量,同时控制了成本和响应时间,因为模型对每个 Token 只使用了全部参数中的一小部分。具体来说,Mixtral 拥有 450 亿的参数总量,但每个 Token 只用到了 120 亿参数。因此,它在处理输入和输出时,无论是速度还是成本,都与 120 亿参数的模型相当,"公司在一篇博客文章中解释道。

Mixtral 8x7B 也采用 Apache 2.0 许可发布,并提供免费下载。另一个模型,Mistral-medium,可以在 Mistral 的开发者平台上找到。据称,它的性能超过了 Mistral AI 的其他模型,但它仅通过付费的 API 平台提供---没有下载选项。

相关推荐
taxunjishu15 分钟前
欧姆龙 NX1P2 借助 Ethernet/ip 转 Modbus RTU,与德马泰克设备共创仓库精准货位管理方案
人工智能·嵌入式硬件·物联网·工业物联网·工业自动化
扫地的小何尚27 分钟前
一小时内使用NVIDIA Nemotron创建你自己的Bash计算机使用智能体
开发语言·人工智能·chrome·bash·gpu·nvidia
UWA42 分钟前
有什么指标可以判断手机是否降频
人工智能·智能手机·性能优化·memory·游戏开发
San3042 分钟前
AI 歌词生成器:使用 OpenAI 打造你的专属作词助手
javascript·人工智能·node.js
第七序章1 小时前
【C + +】unordered_set 和 unordered_map 的用法、区别、性能全解析
数据结构·c++·人工智能·算法·哈希算法·1024程序员节
一只落魄的蜂鸟1 小时前
《图解技术体系》Wonderful talk AI ~~GPT
人工智能·gpt
DisonTangor1 小时前
【2B篇】阿里通义 Qwen3-VL 新增 2B、32B 两个模型尺寸,手机也能轻松运行
人工智能·计算机视觉·语言模型·开源·aigc
Francek Chen1 小时前
【自然语言处理】预训练01:词嵌入(word2vec)
人工智能·自然语言处理·word2vec
Dongsheng_20191 小时前
【手机篇】AI深度学习在手机摄像头模组支架外观检测应用方案
人工智能·智能手机
郝学胜-神的一滴1 小时前
主成分分析(PCA)在计算机图形学中的深入解析与应用
开发语言·人工智能·算法·机器学习·1024程序员节