快速掌握时序数据库 + TDengine 学习指南

1. 时序数据库核心认知

数据特征：高写入吞吐、时序有序性、保留期（TTL）、降采样与压缩、插值与对齐、窗口聚合。
典型场景：物联网传感器、工业监控、日志/指标(Metrics)、金融行情、车联网。
关键能力评估维度：写入性能、压缩率、查询延迟（最新点/窗口/大范围扫描）、保留策略、分区与冷热分层、流式计算/订阅、运维易用性。
常用数据建模要点 ：
- 明确设备/标签（tags）与测点字段（columns）分离；
- 控制标签基数，避免过多高基数 tag；
- 预设保留期与分区策略；
- 设计写入批量与乱序容忍窗口。

2. TDengine 快速入门

安装与启动：支持本地包、Docker、K8s（参阅官方快速开始）。
基础对象：Database（含 TTL/压缩/副本）、超级表（STable，定义标签+字段）、子表（具体设备实例）。
基础操作 ：
- 创建库/表：CREATE DATABASE ...; CREATE STABLE ...; CREATE TABLE USING ... TAGS (...)
- 写入：INSERT INTO subtable USING stable TAGS (...) VALUES (...); 支持批量/乱序。
- 查询：SELECT, FIRST/LAST, INTERVAL, SLIDING, FILL, STATE_WINDOW, SESSION_WINDOW。
订阅与流式：TMQ（Kafka 协议风格），支持消费组、重平衡、精确一次。
运维要点：监控 taosd，关注内存、WAL、磁盘 IOPS/吞吐，定期检查数据保留与压缩。

3. 学习路线（分阶段）

概念速读：时序数据特性 + TDengine 核心对象（库/超级表/子表/标签）。
10 分钟上手：安装 → 建库/建表/写入/查询 → 简单聚合与窗口。
数据建模进阶：标签设计、分区与 TTL、批量写入与乱序控制。
查询模式：最近点查询、时间窗口聚合、降采样、补齐、会话窗口。
性能优化：写入批量/并发、客户端参数、压缩与存储策略、查询索引与标签基数控制。
流式与集成：TMQ 消费、与 Kafka/MQ、与 Flink/Spark/K8s 的集成模式。
运维与高可用：多副本、数据迁移/备份、监控指标、告警。
实战练习：物联网/监控指标示例数据集，完成端到端写入、查询、可视化。

4. 高频知识点速查

窗口/降采样 ：INTERVAL 1m SLIDING 10s FILL(prev/NULL/linear)
会话窗口 ：SESSION_WINDOW(ts_col, 10m) 聚合同一会话内的事件。
标签高基数防范：合并稀疏标签，使用枚举/字典映射；避免把唯一 ID 直接做 tag，可放入字段或分表。
TTL/分区 ：库级 KEEP/DURATION；合理分区避免单分区过大。
写入性能：批量写、压测时控制乱序比例；客户端连接池。
订阅消费：设置消费组，处理重平衡；恰当提交 offset 保证精确一次。
运维监控：关注 WAL、存储使用、写入/查询 QPS、慢查询、负载均衡。

5. 官方/权威资料（精选）

官方文档 ：
- 中文首页: https://docs.taosdata.com
- 安装与快速开始: https://docs.taosdata.com/get-started/
- 数据建模: https://docs.taosdata.com/basic/model/
- SQL 参考: https://docs.taosdata.com/reference/taos-sql/
- TMQ/订阅: https://docs.taosdata.com/reference/taos-sql/tmq/
- 运维与监控: https://docs.taosdata.com/operation/
示例与客户端 ：
- 多语言示例仓库: https://github.com/taosdata/TDengine/tree/develop/examples
- Python/Go/Java/C# 等 SDK 参考: https://docs.tdengine.com/zh/develop/connector/
实践文章与博客 ：
- 官方博客: https://www.taosdata.com/blog
视频/培训 ：
- B 站官方频道（搜索 "TDengine"）。
社区：
- GitHub: https://github.com/taosdata/TDengine/issues
- 论坛/问答: https://ask.taosdata.com/

6. 推荐练习路径

练习 1：10 分钟 Demo ：安装 → 建库/超级表/子表 → 写入 1 小时模拟传感器数据 → INTERVAL 聚合。
练习 2：标签设计优化：尝试高基数标签与合并策略，对比查询与存储差异。
练习 3：降采样与补齐 ：用 INTERVAL + FILL 生成 1m/5m 级别指标曲线。
练习 4：会话窗口：基于日志/事件流做会话切分与统计。
练习 5：TMQ 流式：启动 TMQ 消费组，实时消费并落盘/入 Kafka，再对比消费延迟与精确一次。
练习 6：运维监控：采集 taosd 指标，设置慢查询告警和存储阈值。

7. 速查清单

安装后第一步：建库时设定 KEEP/BLOCKS/副本数。
写入：批量、小乱序；遇到乱序过大调宽乱序窗口。
查询：充分利用标签过滤；大范围聚合用合适窗口和 SLIDING。
存储：关注压缩率与冷热分层；定期检查磁盘和 WAL。
流式：消费组 + 定期提交 offset；监控重平衡与滞后。
运维：备份/迁移前先降流量；监控 CPU/IO/内存与慢查询。

关于 TDengine

TDengine 专为物联网IoT平台、工业大数据平台设计。其中，TDengine TSDB 是一款高性能、分布式的时序数据库（Time Series Database），同时它还带有内建的缓存、流式计算、数据订阅等系统功能；TDengine IDMP 是一款AI原生工业数据管理平台，它通过树状层次结构建立数据目录，对数据进行标准化、情景化，并通过 AI 提供实时分析、可视化、事件管理与报警等功能。