TDengine 与其他时序数据库对比：InfluxDB/TimescaleDB 选型指南（一）

引言

在当今数字化时代，物联网（IoT）、工业互联网等领域蓬勃发展，产生了海量的时序数据。这些数据记录了设备状态、传感器读数、业务指标等随时间变化的信息，对于企业的运营监控、数据分析和决策制定起着关键作用。为了高效地存储和处理这些时序数据，时序数据库应运而生。TDengine、InfluxDB 和 TimescaleDB 作为时序数据库领域的佼佼者，各自具有独特的优势和特点，在不同的场景中得到了广泛应用。本文将对这三款数据库进行详细的对比分析，为开发者和企业在数据库选型时提供参考依据。

一、三款数据库简介

（一）TDengine

TDengine 是一款专为物联网（IoT）、车联网、工业互联网、IT 运维等场景设计和优化的开源、高性能、分布式、云原生时序数据库。它的核心代码完全开源，拥有活跃的社区支持，为开发者提供了丰富的学习资源和技术交流平台。TDengine 不仅提供了传统数据库的基本功能，还集成了消息队列、缓存、流式计算等模块，极大地简化了数据处理平台的架构，降低了开发和运维成本。

（二）InfluxDB

InfluxDB 是一个用 Go 语言编写的开源时序数据库，由 InfluxData 公司开发和维护。它专为处理高写入频率和大规模时间序列数据而设计，在监控和运维领域应用广泛，常用于存储和分析服务器、网络设备、传感器和应用程序的指标数据。InfluxDB 具有高性能、可扩展性强、易用性好等特点，并提供了丰富的数据查询和处理功能，其自定义的 TSM（Time-Structured Merge Tree）存储引擎，能有效提升数据写入和查询的效率。

（三）TimescaleDB

TimescaleDB 是一个基于 PostgreSQL 的开源时序数据库，以插件化的形式部署，并随着 PostgreSQL 的版本升级而升级。它支持标准的 SQL 查询语言，这使得熟悉 SQL 的开发者可以轻松上手。同时，TimescaleDB 利用 PostgreSQL 的丰富功能，如事务处理、ACID（原子性、一致性、隔离性和持久性）支持等，还支持复杂的数据处理功能，包括数据聚合、窗口函数等，非常适合需要进行复杂数据分析和处理的场景。

二、性能对比

为了更直观地了解 TDengine、InfluxDB 和 TimescaleDB 的性能差异，我们参考 TSBS（Time Series Benchmark Suite）基准测试的数据，从写入性能、查询性能和存储性能三个方面进行对比分析。TSBS 是一个专门用于时序数据库性能测试的工具，能够模拟多种真实场景下的时序数据读写操作，其测试结果具有较高的可信度和参考价值。在测试中，我们保证了硬件环境、数据规模和测试脚本的一致性，以确保测试结果的公平性和准确性。

（一）写入性能

在写入性能方面，TDengine 展现出了明显的优势。根据 TSBS 基准测试数据，在不同的场景下，TDengine 的写入速度均远超 InfluxDB 和 TimescaleDB。在场景二的测试中，TDengine 的写入性能最大达到了 TimescaleDB 的 6.7 倍，InfluxDB 的 10.6 倍。这得益于 TDengine 独特的数据模型和存储引擎设计，它能够充分利用时序数据的特点，将数据按时间顺序进行高效的组织和存储，减少了写入过程中的磁盘 I/O 操作和数据碎片化，从而大大提高了写入性能。

同时，TDengine 在写入过程中消耗的计算（CPU）资源和磁盘 I/O 开销也相对较低。以场景四为例，在写入 1,000,000 devices × 10 metrics 的数据时，TDengine 对服务器的 CPU 需求最小，峰值仅使用了 17% 左右的服务器 CPU 资源，而 InfluxDB 和 TimescaleDB 在写入过程中对 CPU 资源的占用则明显更高。在磁盘 I/O 方面，TDengine 在写入过程中对于磁盘写入能力的占用远小于 InfluxDB 和 TimescaleDB，只占用了部分磁盘写入能力（125MiB/Sec. 3000IOPS）。这使得 TDengine 在处理大规模时序数据写入时，能够保持较低的系统负载，确保系统的稳定性和高效性。

（二）查询性能

在查询性能方面，TDengine 同样表现出色。在场景一和场景二的不同类型查询中，TDengine 的查询平均响应时间均优于 InfluxDB 和 TimescaleDB。尤其是在复杂查询（Complex queries）类型中，TDengine 的优势更加明显，其查询性能最高达到了 InfluxDB 的 37 倍、TimescaleDB 的 28.6 倍。

这是因为 TDengine 针对时序数据的查询特点进行了深度优化，采用了一系列高效的查询算法和索引机制。TDengine 支持 SQL 查询语言，并对其进行了扩展，增加了许多针对时序数据的函数和操作符，使得用户可以方便地进行各种复杂的时序数据分析。同时，TDengine 的存储引擎能够快速定位和读取所需的数据，减少了查询过程中的数据扫描和过滤时间，从而提高了查询效率。例如，在进行时间窗口聚合查询时，TDengine 能够快速地对指定时间范围内的数据进行聚合计算，而 InfluxDB 和 TimescaleDB 在处理大规模数据集时，查询性能则会明显下降。

（三）存储性能

在存储性能方面，TDengine 采用了领先的压缩算法，能够将数据压缩至原始大小的 1/10，大大降低了存储成本。相比之下，InfluxDB 和 TimescaleDB 在存储相同规模的数据时，占用的磁盘空间明显大于 TDengine。根据 TSBS 基准测试报告，在部分场景中，TimescaleDB 落盘数据规模最高达到了 TDengine 的 26.9 倍，InfluxDB 磁盘占用最高是 TDengine 的 4.5 倍。

随着数据集规模的增长，TDengine 在数据存储方面的优势愈加明显。这是因为 TDengine 的压缩算法能够更好地适应时序数据的特点，对数据进行有效的压缩。同时，TDengine 还提供了数据分级存储、S3 存储等功能，能够将不同时间段的数据存储在挂载的不同介质上的目录里，实现不同 "热度" 的数据存储在不同的存储介质上，进一步降低了存储成本，提高了存储效率。

三、功能特性对比

（一）数据模型

TDengine 采用了独特的超级表（Super Table）和子表（Sub Table）数据模型。超级表作为一种模板，定义了一组具有相同数据结构的子表的公共属性，如列（字段）和标签（Tags）。子表则是从超级表派生而来，继承了超级表的列结构，并拥有自己的标签值，用于实际存储数据。例如，在一个物联网场景中，可以创建一个超级表 "devices"，包含 "ts"（时间戳）、"temperature"（温度）、"humidity"（湿度）等列，以及 "device_id"（设备 ID）、"location"（位置）等标签。然后，为每个具体的设备创建一个子表，如 "device_001"，通过指定不同的标签值来区分不同的设备。这种数据模型能够有效地组织和管理大量具有相似结构的时序数据，提高数据查询和分析的效率。

InfluxDB 的数据模型基于标签（Tags）和字段（Fields）。标签用于索引和过滤数据，相当于传统数据库中的索引列，它可以帮助用户快速定位和查询特定的数据。字段则用于存储实际的数值数据，是没有索引的列。例如，在存储服务器监控数据时，可以将 "server_name"（服务器名称）、"region"（区域）等作为标签，将 "cpu_usage"（CPU 使用率）、"memory_usage"（内存使用率）等作为字段。所有的数据都会根据时间戳进行排序，这种数据模型简单灵活，适用于各种时序数据的存储和查询场景。

TimescaleDB 基于 PostgreSQL 的表结构，通过将普通表转换为超表（Hypertable）来处理时序数据。超表会自动按时间和空间进行分片（chunk），空间维度指属性字段，如传感器 ID、用户 ID 等。例如，创建一个用于存储传感器数据的超表 "sensor_data"，包含 "time"（时间）、"sensor_id"（传感器 ID）、"value"（数据值）等列，系统会根据时间和传感器 ID 对数据进行自动分片存储。这种数据模型充分利用了 PostgreSQL 的特性，支持复杂的 SQL 查询和事务处理，适合需要进行复杂数据分析和处理的场景。

（二）SQL 支持

TDengine 支持标准的 SQL 查询语言，并在其基础上进行了扩展，增加了许多针对时序数据的函数和操作符。用户可以使用熟悉的 SQL 语法进行数据的插入、查询、更新和删除操作，同时还能利用 TDengine 提供的扩展功能，如时间窗口函数、数据聚合函数等，方便地进行时序数据分析。例如，使用 "SELECT AVG (temperature) FROM devices WHERE location = 'Beijing' GROUP BY time (1h)" 语句，可以查询出位于北京的设备每小时的平均温度。这种对标准 SQL 的支持，使得熟悉 SQL 的开发者可以快速上手 TDengine，降低了学习成本。

InfluxDB 在 v1 版本中使用类似于 SQL 的查询语言 InfluxQL，用户可以使用它进行数据的查询和分析。InfluxQL 支持多种查询操作，包括选择、过滤、排序、分组、聚合等，能够满足基本的时序数据查询需求。然而，从 v2 版本开始，InfluxDB 引入了新的查询语言 Flux 。Flux 是一种功能更强大、更灵活的查询语言，支持更复杂的查询操作，如跨桶查询、数据转换和处理等。但对于习惯了 SQL 语法的开发者来说，学习 Flux 可能需要一定的时间和成本。例如，使用 Flux 查询过去一小时内所有服务器的平均 CPU 使用率，可以使用如下语句："from (bucket: "telegraf") |> range (start: -1h) |> filter (fn: (r) => r._measurement == "cpu" and r._field == "usage_idle") |> aggregateWindow (every: 1h, fn: mean)" 。

TimescaleDB 完全支持标准的 SQL 查询语言，因为它是基于 PostgreSQL 开发的，继承了 PostgreSQL 强大的 SQL 处理能力。用户可以使用标准的 SQL 语句进行数据的操作和分析，同时还能利用 TimescaleDB 提供的时序数据处理功能，如自动分片、时间序列函数等。例如，使用 "SELECT time_bucket ('1 hour', time), AVG (temperature) FROM sensor_data GROUP BY time_bucket ('1 hour', time)" 语句，可以查询出传感器数据每小时的平均温度。这种对标准 SQL 的全面支持，使得 TimescaleDB 在处理复杂的数据分析任务时具有很大的优势，同时也便于与其他基于 SQL 的工具和系统进行集成。

（三）分布式与扩展性

TDengine 从设计之初就考虑了分布式和扩展性，其集群功能完全开源。TDengine 采用了分布式的元数据管理和数据存储架构，能够支持水平扩展，轻松应对大规模数据和高并发的读写请求。在一个拥有 10 亿时间线和 100 个数据节点的情况下，TDengine 的性能也能得到很好的保证，并且能够有效地解决时序数据处理中的 "高基数" 问题。例如，当数据量不断增加时，可以通过添加更多的节点来扩展集群的存储和计算能力，而无需对应用程序进行大规模的修改。这种分布式架构使得 TDengine 在处理海量时序数据时具有很高的灵活性和可扩展性。

InfluxDB 的开源版本最初只支持单机部署，企业版才具备完整的集群功能。在企业版中，InfluxDB 通过集群部署可以实现数据的分布式存储和查询，提高系统的性能和可用性。然而，对于一些预算有限的小型企业或个人开发者来说，使用 InfluxDB 的企业版可能会面临成本较高的问题。同时，InfluxDB 在分布式环境下的一致性有一些限制，尤其在写入操作时，需要进行额外的配置和管理来确保数据的一致性。例如，在进行数据写入时，需要考虑数据在多个节点之间的同步和复制，以避免数据丢失或不一致的情况发生。

TimescaleDB 支持线性扩展，它通过将数据自动分片存储在多个节点上，实现了水平扩展的能力。TimescaleDB 可以根据数据的时间和空间维度进行自动分区，将不同时间段或不同区域的数据存储在不同的分片（chunk）中，从而提高查询和写入的性能。同时，TimescaleDB 支持多个 SERVER 和多个 CHUNK 的并行查询，能够充分利用集群的计算资源，加快查询速度。例如，在处理大规模的传感器数据时，可以将不同传感器的数据存储在不同的分片中，当进行查询时，多个分片可以并行处理查询请求，提高查询效率。然而，与 TDengine 相比，TimescaleDB 在分布式扩展性方面的功能相对较弱，尤其是在处理超大规模数据和高并发场景时，可能会面临一些性能瓶颈。

（四）其他特性

TDengine 除了具备基本的时序数据库功能外，还自带了缓存、流式计算和数据订阅等功能。缓存功能可以提高数据的读取速度，减少磁盘 I/O 操作，从而提升系统的整体性能。流式计算功能允许用户对实时流入的数据进行实时分析和处理，及时发现数据中的异常和趋势。数据订阅功能则可以实现数据的安全、灵活共享，用户可以通过订阅的方式获取感兴趣的数据，而无需直接访问数据库。例如，在一个智能工厂的场景中，通过 TDengine 的流式计算功能，可以实时监测设备的运行状态，当发现设备出现异常时，及时发出警报通知维护人员进行处理。

InfluxDB 具有保留策略（Retention Policy），用户可以通过设置保留策略来自动清理旧数据，控制数据的存储时间和空间占用。例如，可以设置某个数据库中的数据只保留 30 天，超过 30 天的数据将被自动删除。此外，InfluxDB 还支持持续查询（Continuous Query），能够自动定期计算聚合数据，并将结果存储在指定的位置，提高了查询的效率。例如，通过持续查询，可以每小时计算一次服务器的平均负载，并将结果存储在一个新的测量（measurement）中，以便后续查询和分析。

TimescaleDB 利用了 PostgreSQL 的丰富特性，如支持 GIS（地理信息系统）、JOIN 操作等，方便进行复杂的数据处理和分析。同时，TimescaleDB 还支持流复制（Stream Replication）和 PITR（Point-in-Time Recovery，时间点恢复）等功能，提高了数据的安全性和可靠性。流复制可以实现数据在多个节点之间的实时同步，当主节点出现故障时，从节点可以迅速接管服务，保证系统的高可用性。PITR 功能则可以将数据库恢复到某个特定的时间点，以便在数据丢失或损坏时进行数据恢复。例如，在一个金融交易系统中，利用 TimescaleDB 的流复制和 PITR 功能，可以确保交易数据的安全和完整，即使出现硬件故障或人为错误，也能够快速恢复数据，保证业务的正常运行