TDengine 数据库建模最佳实践

核心建模原则

一个数据采集点一张表 :每个数据采集点(如传感器、设备)对应一张子表,存储其时间序列数据;同类型数据采集点通过 "超级表"(Stable)进行逻辑聚合管理。超级表定义表结构(时间戳 + 采集指标列)和标签(静态属性,如设备型号、位置),子表通过继承超级表并指定标签值创建。

建模方式选择

多列模型

  • 适用场景 : 相同类型设备采集指标完全相同、各指标同时采集(时间戳一致)、数据同一消息上报。

  • 建模方法 : 为设备类型创建多列超级表(时间戳 + 各采集指标列),为每个设备创建子表(继承超级表,子表列对应采集指标)。

    扩展场景(采集指标不完全相同) :若设备有少量个性化指标(总列数≤4096,建议≤500),创建包含所有指标的 "大宽表" 超级表,子表中不具备的指标填 NULL。

单列模型

  • 适用场景 :设备采集指标不固定 / 个性化指标总数 + 共有指标>1024、各指标采集时间戳不同、数据分消息上报。
  • 建模方法 :创建单列超级表(时间戳 + 采集值),标签增加 "采集指标 ID";每个设备的每个指标单独创建子表,不同数据类型(数值 / 布尔 / 字符串)分不同超级表。

多列与单列模型对比

  • 多列模型 :插入 / 存储效率更高,适合固定指标、同时间戳采集的场景。
  • 单列模型 :灵活性更高,适合指标频繁变化、不同时间戳采集的场景。

标签与查询优化

  • 标签支持事后增删改,建模时可先不确定分析维度;标签可设计为树状结构(如 "北京・朝阳・望京"),缩小查询范围。
  • 超级表支持通过标签过滤(如WHERE loc="BJ.chaoyang"),实现多维分析。

数据分层设计

  • 贴源层 :数据模型与数据源(如设备上报格式)1:1 对齐,简化采集流程。
  • 整合层 :对贴源层数据进行时间戳对齐、关联整合、汇聚转换,衔接采集与应用需求。
  • 访问层 :按业务主题(如车间、产品线)分类建模,支持实时监控与批量查询。

分库分表原则

分表条件 :列数>4096、列间无关联需联合查询、采集频率不一致。

分库条件 :采集点采集频率相差百倍以上、不同库采集点无业务关联。

边界限制

  • 表名:仅支持英文字符、数字、下划线,不允许数字开头,不区分大小写。
  • 列限制:每行最多 4096 列(建议≤200 列),总长度≤64KB;SELECT 结果最多 4096 列。
  • 标签限制:最多 128 个标签,标签值总长度≤16KB。

关键注意事项

  • 标签与子表 :鼓励多使用标签(最多 128 个)和子表(百万级子表属正常),避免单表管理所有数据
  • 数据类型优化 :能设为int类型的标签 / 指标,避免使用字符串
  • 资源规划 :子表数量大时需多分配虚拟节点(vnode),避免百万级子表仅用 2 个 vnode。

总结

TDengine 建模需根据设备类型、指标特性(是否固定、时间戳是否一致)选择多列或单列模型,通过超级表管理同类型设备,合理分库分表,并利用标签优化查询效率;同时可结合数据分层设计满足采集与应用需求。

关于 TDengine

TDengine 是一款专为物联网、工业互联网等场景设计并优化的大数据平台,其核心模块是高性能、集群开源、云原生、极简的时序数据库。它能安全高效地将大量设备每天产生的高达 TB 甚至 PB 级的数据进行汇聚、存储、分析和分发,并提供 AI 智能体对数据进行预测与异常检测,提供实时的商业洞察。

相关推荐
胚芽鞘68141 分钟前
关于java项目中maven的理解
java·数据库·maven
Edingbrugh.南空3 小时前
Flink自定义函数
大数据·flink
gaosushexiangji4 小时前
利用sCMOS科学相机测量激光散射强度
大数据·人工智能·数码相机·计算机视觉
行之无边4 小时前
零基础入门物联网-远程门禁开关:硬件介绍
物联网
sun0077004 小时前
mysql索引底层原理
数据库·mysql
无级程序员6 小时前
大数据平台之ranger与ldap集成,同步用户和组
大数据·hadoop
workflower7 小时前
MDSE和敏捷开发相互矛盾之处:方法论本质的冲突
数据库·软件工程·敏捷流程·极限编程
Tony小周7 小时前
实现一个点击输入框可以弹出的数字软键盘控件 qt 5.12
开发语言·数据库·qt
lifallen7 小时前
Paimon 原子提交实现
java·大数据·数据结构·数据库·后端·算法