《向量数据库指南》——Milvus Cloud当初为什么选择向量数据库这个赛道呢?

我们公司专注于向量数据库大约可以追溯到 2018 年左右。当时,向量数据库的概念并不广泛。我们的 CEO 力排众议,认为这个领域有巨大潜力,因为这与我们的愿景高度契合。我们的公司定位是构建一个能够在云上处理非结构化数据的基础设施产品。经过大量调研,我们意识到向量检索可能是未来处理非结构化数据语义和信息的关键。

另外一个重要的因素是,向量数据库与模型相比具有明显的区别。我们早在此前就认识到,处理非结构化数据需要依赖人工智能,需要模型的支持。然而,那时的模型与现在的 ChatGPT 等大型模型相比,性能有限。

作为初创公司,如果我们专注于开发模型方向,可能难以取得今天的成就,也难以像 ChatGPT 这样发布出色的产品。因此,我们决定将注意力放在基础设施上。鉴于我们团队成员都具备基础设施的背景,我们设想了一个能够有效支持高维数据处理的基础设施产品,即向量数据库的概念。

从 2019 年开始,我们便着手开发这个产品。当时,我们已经吸引了许多关注,尽管当时社区用户主要集中在传统的应用场景,如图像搜索和 NLP 领域的问答机器人。直到去年,随着大型模型的兴起,数据库的使用场景和用户需求发生了重大变化,也带火了向量数据库的需求。这个现象表明数据库的第一应用场景正在演变,用户对能力的需求也发生了显著改变。

相关推荐
书山有鹿44 分钟前
PostgreSQL psql 命令和常用的 SQL 语句整理
数据库·sql·postgresql
凯子坚持 c1 小时前
从 0 到 1:ComfyUI AI 工作流抠图构建全实践
大数据·人工智能
背太阳的牧羊人2 小时前
OpenAI Embedding 和密集检索(如 BERT/DPR)进行语义相似度搜索有什么区别和联系
人工智能·bert·embedding
GottdesKrieges3 小时前
OceanBase数据库磁盘空间管理
java·数据库·oceanbase
光与电子KOYUELEC加油奋斗3 小时前
Molex莫仕连接器:增强高级驾驶辅助系统,打造更安全的汽车
人工智能·光与电子
Themberfue4 小时前
Redis ⑦-set | Zset
java·开发语言·数据库·redis·sql·缓存
__lost5 小时前
MATLAB画出3d的常见复杂有机分子和矿物的分子结构
开发语言·人工智能·matlab·化学·分子结构
每天都要写算法(努力版)5 小时前
【神经网络与深度学习】五折交叉验证(5-Fold Cross-Validation)
人工智能·深度学习·神经网络
郭不耐5 小时前
DeepSeek智能时空数据分析(六):大模型NL2SQL绘制城市之间连线
人工智能·数据分析·时序数据库·数据可视化·deepseek
winfredzhang6 小时前
Deepseek 生成新玩法:从文本到可下载 Word 文档?思路与实践
人工智能·word·deepseek