TDengine 数据库建模最佳实践

TDengine （老段）2025-07-11 20:06

核心建模原则

一个数据采集点一张表：每个数据采集点（如传感器、设备）对应一张子表，存储其时间序列数据；同类型数据采集点通过 "超级表"（Stable）进行逻辑聚合管理。超级表定义表结构（时间戳 + 采集指标列）和标签（静态属性，如设备型号、位置），子表通过继承超级表并指定标签值创建。

建模方式选择

多列模型

适用场景 : 相同类型设备采集指标完全相同、各指标同时采集（时间戳一致）、数据同一消息上报。
建模方法 : 为设备类型创建多列超级表（时间戳 + 各采集指标列），为每个设备创建子表（继承超级表，子表列对应采集指标）。

扩展场景（采集指标不完全相同）：若设备有少量个性化指标（总列数≤4096，建议≤500），创建包含所有指标的 "大宽表" 超级表，子表中不具备的指标填 NULL。

单列模型

适用场景：设备采集指标不固定 / 个性化指标总数 + 共有指标＞1024、各指标采集时间戳不同、数据分消息上报。
建模方法：创建单列超级表（时间戳 + 采集值），标签增加 "采集指标 ID"；每个设备的每个指标单独创建子表，不同数据类型（数值 / 布尔 / 字符串）分不同超级表。

多列与单列模型对比

多列模型：插入 / 存储效率更高，适合固定指标、同时间戳采集的场景。
单列模型：灵活性更高，适合指标频繁变化、不同时间戳采集的场景。

标签与查询优化

标签支持事后增删改，建模时可先不确定分析维度；标签可设计为树状结构（如 "北京・朝阳・望京"），缩小查询范围。
超级表支持通过标签过滤（如WHERE loc="BJ.chaoyang"），实现多维分析。

数据分层设计

贴源层：数据模型与数据源（如设备上报格式）1:1 对齐，简化采集流程。
整合层：对贴源层数据进行时间戳对齐、关联整合、汇聚转换，衔接采集与应用需求。
访问层：按业务主题（如车间、产品线）分类建模，支持实时监控与批量查询。

分库分表原则

分表条件：列数＞4096、列间无关联需联合查询、采集频率不一致。

分库条件：采集点采集频率相差百倍以上、不同库采集点无业务关联。

边界限制

表名：仅支持英文字符、数字、下划线，不允许数字开头，不区分大小写。
列限制：每行最多 4096 列（建议≤200 列），总长度≤64KB；SELECT 结果最多 4096 列。
标签限制：最多 128 个标签，标签值总长度≤16KB。

关键注意事项

标签与子表：鼓励多使用标签（最多 128 个）和子表（百万级子表属正常），避免单表管理所有数据
。
数据类型优化：能设为int类型的标签 / 指标，避免使用字符串
。
资源规划：子表数量大时需多分配虚拟节点（vnode），避免百万级子表仅用 2 个 vnode。

总结

TDengine 建模需根据设备类型、指标特性（是否固定、时间戳是否一致）选择多列或单列模型，通过超级表管理同类型设备，合理分库分表，并利用标签优化查询效率；同时可结合数据分层设计满足采集与应用需求。

关于 TDengine

TDengine 是一款专为物联网、工业互联网等场景设计并优化的大数据平台，其核心模块是高性能、集群开源、云原生、极简的时序数据库。它能安全高效地将大量设备每天产生的高达 TB 甚至 PB 级的数据进行汇聚、存储、分析和分发，并提供 AI 智能体对数据进行预测与异常检测，提供实时的商业洞察。

上一篇：机器学习核心算法：PCA与K-Means解析

下一篇：微服务项目远程调用时的负载均衡是如何实现的?

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？