GreptimeDB v0.12 发布,开源 Rust 时序数据库

GreptimeDB 是由格睿科技开发的开源时序数据库,基于 Rust 语言构建,以云原生、高性能、低成本为核心优势。根据现有信息,其最新版本 v0.12 的具体特性尚未在提供的摘要中明确提及,但结合 GreptimeDB 的发展历程和技术路线,可以推测其可能延续以下核心优势:

  1. 云原生架构

    支持分布式部署,分离计算与存储,利用云对象存储(如 S3)实现低成本存储,存储成本降低 50 倍,同时具备无限水平扩展能力。

  2. 高性能与存储优化

    采用自研存储引擎 Mito,支持列式存储与自适应压缩(30 倍无损压缩),提升查询性能与资源利用率。分布式并行查询引擎优化高基数场景,支持实时分析。

  3. 多协议兼容

    支持 SQL、PromQL、InfluxDB 行协议、OpenTelemetry 等,无缝对接现有监控与分析工具,降低迁移成本。

  4. 边缘计算与车云协同

    轻量级二进制文件可部署于车端或边缘设备,结合云端企业版实现边云数据协同,降低车端流量成本至 1/10。

  5. 生态扩展

    近期版本(如 v0.10)引入向量搜索功能,与蚂蚁集团 VSAG 索引库合作,检索性能提升 5 倍,支持图片嵌入等 AI 场景。

  6. 未来演进方向

    根据 Roadmap,GreptimeDB 计划在 2024 年推出智能索引、流计算组件 Greptime Flow、日志引擎等,进一步强化时序数据处理能力。

GreptimeDB 在其发展过程中引入了向量搜索功能

功能特点

  1. 与先进索引库合作:GreptimeDB 与蚂蚁集团的 VSAG 索引库进行合作。VSAG 索引库是一种高效的向量索引结构,通过这种合作,GreptimeDB 在向量搜索方面的检索性能得到了显著提升,据相关信息表明检索性能提升了 5 倍。这意味着在处理大规模向量数据时,GreptimeDB 能够更快地找到与查询向量最相似的向量数据,大大提高了搜索效率。
  2. 支持多种 AI 场景:能够支持如图片嵌入等 AI 场景。以图片为例,GreptimeDB 可以将图片转换为向量表示并存储在数据库中,当需要查找相似图片时,通过向量搜索功能可以快速定位到相关图片。这对于图像识别、图像搜索等应用场景非常有帮助,使得 GreptimeDB 可以在 AI 领域的应用中发挥重要作用。
  3. 融入整体数据库架构:向量搜索功能是集成在 GreptimeDB 整体的数据库架构中的,与数据库的其他功能(如时序数据处理、SQL 查询等)能够很好地协同工作。用户可以在同一个数据库系统中同时处理时序数据和进行向量搜索,无需额外搭建复杂的多系统架构,降低了系统的复杂度和管理成本。

应用场景

  • 图像搜索:在图像数据库中,用户可以上传一张图片,通过 GreptimeDB 的向量搜索功能找到与之相似的其他图片,可应用于电商平台的商品图片搜索、图片素材库的搜索等场景。
  • 文本推荐:将文本转换为向量后,根据用户输入的文本向量,搜索与之相似的文本内容,为用户推荐相关的文章、新闻等,适用于新闻资讯平台、知识管理系统等。
  • AI 模型训练数据筛选:在 AI 模型训练过程中,需要从大量的数据中筛选出与训练目标相似的数据。GreptimeDB 的向量搜索功能可以帮助快速定位这些数据,提高模型训练的效率和质量。
相关推荐
rannn_1114 分钟前
【MySQL学习|黑马笔记|Day3】多表查询(多表关系、内连接、外连接、自连接、联合查询、子查询),事务(简介、操作、四大体系、并发事务问题、事务隔离级别)
数据库·笔记·后端·学习·mysql
小云数据库服务专线36 分钟前
GaussDB 约束的语法
数据库·sql·gaussdb
IT邦德43 分钟前
少林寺用什么数据库?
数据库
俊哥V1 小时前
字节跳动“扣子”(Coze)开源:AI智能体生态的技术革命
人工智能·开源
Fireworkitte2 小时前
Couchbase 详解
数据库
涛思数据(TDengine)2 小时前
时序数据库厂商 TDengine 发布 AI 原生的工业数据管理平台 IDMP,“无问智推”改变数据消费范式
大数据·运维·数据库·人工智能·tdengine
想你依然心痛2 小时前
Spark大数据分与实践笔记(第五章 HBase分布式数据库-04)
大数据·数据库·分布式
小王子10242 小时前
Django模型迁移指南:从命令用法到最佳实践
数据库·mysql·django·迁移回滚
l_c-l-o-u-d_22 小时前
第十九周-文档数据库MongoDB、消息队列和微服务
数据库·redis·mongodb
数据狐(DataFox)2 小时前
大数据集分页优化:LIMIT OFFSET的替代方案
数据库·sql·oracle