Mistral AI,成功完成了一轮高达 4.15 亿美元的资金募集。

法国新兴企业 Mistral AI 刚刚完成了备受瞩目的 A 轮融资。公司成功筹集了 3.85 亿欧元,折合当前汇率约为 4.15 亿美元。据 Bloomberg 报道,这一举措将公司估值推至大约 20 亿美元。今天,Mistral AI 也正式向外界开放其商业化平台。

回顾一下,Mistral AI 在不足六个月前就已经完成了 1.12 亿美元的种子轮融资,旨在打造一个能与 OpenAI 竞争的欧洲对手。Mistral AI 由来自谷歌 DeepMind 和 Meta 的前员工共同创立,专注于开发带有开放技术理念的基础模型。

最新一轮融资由 Andreessen Horowitz (a16z) 领投,Lightspeed Venture Partners 再次对这家 AI 企业进行了投资。此外,还有一长串的投资者加入了这一轮融资,包括 Salesforce、BNP Paribas、CMA-CGM、General Catalyst、Elad Gil 和 Conviction。

Mistral AI 的联合创始人兼 CEO Arthur Mensch 在一份声明中表示:"自 Mistral AI 今年 5 月成立以来,我们始终坚持明确的方向:打造一个基于开放、负责任和去中心化技术方法的、具有全球视野的欧洲领军企业。"

9月,Mistral AI 推出了其首个模型 Mistral 7B。这个大语言模型并非旨在与 GPT-4 或 Claude 2 直接竞争,因为它只训练了大约 70 亿 Token 的"较小"数据集。

公司选择不通过 API 提供 Mistral 7B 模型的访问,而是允许人们免费下载,开发者可以在自己的设备和服务器上运行。该模型基于 Apache 2.0 许可发布,这是一种开源许可证,除了要求署名外,没有其他使用或复制的限制。尽管任何人都可以运行这个模型,但它是在闭门造车的情况下,使用专有的且未公开的数据集开发出来的。

Mistral AI 在塑造关于欧盟 AI 法案的讨论中也扮演了重要角色。这家法国 AI 初创公司一直在游说,争取基础模型的完全豁免,认为法规应当针对最终用户直接使用的产品和公司的具体应用场景。

欧盟立法者最近达成了一项政治协议。从事基础模型研发的公司将需要满足一定的透明度要求,并且必须公开技术文档以及数据集内容的概要。

Mistral AI 最优秀的模型现在只能通过 API 获取

Mistral AI 仍然计划通过其基础模型来实现盈利。因此,公司今天推出了其开发者平台的测试版。通过这个平台,其他公司可以付费通过 API 使用 Mistral AI 的模型。

除了 Mistral 7B 模型(又称"Mistral-tiny"),开发者还可以接触到全新的 Mixtral 8x7B 模型(即"Mistral-small")。这款模型利用了"路由网络"技术,能够处理输入的 Token 并选择最合适的参数群组来响应查询。

"这种技术提升了模型的参数总量,同时控制了成本和响应时间,因为模型对每个 Token 只使用了全部参数中的一小部分。具体来说,Mixtral 拥有 450 亿的参数总量,但每个 Token 只用到了 120 亿参数。因此,它在处理输入和输出时,无论是速度还是成本,都与 120 亿参数的模型相当,"公司在一篇博客文章中解释道。

Mixtral 8x7B 也采用 Apache 2.0 许可发布,并提供免费下载。另一个模型,Mistral-medium,可以在 Mistral 的开发者平台上找到。据称,它的性能超过了 Mistral AI 的其他模型,但它仅通过付费的 API 平台提供---没有下载选项。

相关推荐
Blossom.1182 小时前
使用Python实现简单的人工智能聊天机器人
开发语言·人工智能·python·低代码·数据挖掘·机器人·云计算
科技小E2 小时前
EasyRTC嵌入式音视频通信SDK打造带屏IPC全场景实时通信解决方案
人工智能·音视频
ayiya_Oese2 小时前
[模型部署] 3. 性能优化
人工智能·python·深度学习·神经网络·机器学习·性能优化
仙人掌_lz2 小时前
机器学习与人工智能:NLP分词与文本相似度分析
人工智能·机器学习·自然语言处理
jndingxin2 小时前
OpenCV CUDA模块中矩阵操作------归一化与变换操作
人工智能·opencv
ZStack开发者社区2 小时前
云轴科技ZStack官网上线Support AI,智能助手助力高效技术支持
人工智能·科技
每天都要写算法(努力版)2 小时前
【神经网络与深度学习】通俗易懂的介绍非凸优化问题、梯度消失、梯度爆炸、模型的收敛、模型的发散
人工智能·深度学习·神经网络
Blossom.1183 小时前
Web3.0:互联网的去中心化未来
人工智能·驱动开发·深度学习·web3·去中心化·区块链·交互
kyle~3 小时前
计算机视觉---目标检测(Object Detecting)概览
人工智能·目标检测·计算机视觉
hao_wujing3 小时前
YOLOv8在单目向下多车辆目标检测中的应用
人工智能·yolo·目标检测