qData 数据中台开源版 1.1.2 版本更新公告:新增 Apache Doris 数据源全面支持,稽查规则与转换组件持续完善

在数据中台的实际使用过程中,我们持续关注社区用户的真实反馈与使用场景。

本次 qData 数据中台开源版 1.1.2 更新,围绕 数据源扩展、数据质量能力增强、数据集成易用性提升 三个方向进行了集中优化,并修复了社区中反馈的若干问题。

下面为大家带来本次版本的详细更新说明 👇


一、更新背景

1️⃣ Apache Doris 使用频率持续上升

在社区和用户实践中,我们发现 Apache Doris 作为高性能分析型数据库,被广泛应用于实时数仓与分析场景。

因此,qData 开源版在本次版本中正式将 Apache Doris 纳入核心数据源体系,并实现多模块全面支持。

2️⃣ 数据稽查规则持续扩展

随着数据质量治理场景的不断丰富,原有稽查规则已无法覆盖全部业务需求。

本次更新对稽查规则进行了扩展,增强了对时间逻辑、字段完整性等典型场景的支持。

3️⃣ 数据集成转换能力进一步增强

在数据集成任务中,用户对"灵活处理数据"的需求越来越高。

因此,1.1.2 版本新增多种常用转换组件,让数据处理过程更加顺手、直观。

4️⃣ 社区反馈问题集中修复

感谢社区用户的持续反馈 🙌

本次版本同步修复了多个已在社区提交的 Bug,进一步提升了系统稳定性与使用体验。


二、核心更新内容一览

1️⃣ Apache Doris 数据源全面支持

本次更新中,qData 开源版已在多个核心模块中支持 Apache Doris 数据源:

  • 数据连接

    • 新增 Apache Doris 数据源类型,支持统一配置与管理
  • 数据查询

    • 支持基于 Apache Doris 的数据查询能力
  • 数据集成任务

    • 表输入组件支持 Apache Doris
    • 表输出组件支持 Apache Doris

这意味着,用户可以在 qData 开源版中完成 从 Doris 到 Doris、或 Doris 与其他数据源之间的数据集成与治理,覆盖更多实时分析与数仓场景。


2️⃣ 新增数据稽查规则

为满足更复杂的数据质量校验需求,本次新增以下两类稽查规则:

✅ 时间字段顺序逻辑校验
  • 检查多个时间字段之间是否存在逻辑上的先后关系

  • 适用于:

    • 开始时间 / 结束时间
    • 创建时间 / 更新时间
    • 业务流程时间链路校验等场景
✅ 字段组完整性校验
  • 校验字段组合在全表范围内是否唯一

  • 常用于:

    • 联合主键校验
    • 业务唯一性约束检测

3️⃣ 新增数据转换组件

在数据集成任务中,1.1.2 版本新增多种高频使用的转换组件:

  • 去除重复记录组件

    • 支持基于指定字段进行去重处理
  • 常量转换组件

    • 为字段赋固定值,简化规则类处理逻辑
  • 字段选择 / 修改组件

    • 灵活控制字段的保留、重命名、调整
  • 值映射组件

    • 支持将字段值按规则进行映射转换
    • 适用于编码转换、状态值标准化等场景

这些组件的加入,使得数据集成任务在不依赖外部 ETL 工具的情况下,也能完成更复杂的数据加工逻辑。


4️⃣ 社区 Bug 修复

本次版本同步修复了以下社区已反馈问题:

感谢社区用户的积极反馈,帮助 qData 变得更稳定、更好用 ❤️


三、版本总结

qData 数据中台开源版 1.1.2 版本是一次围绕"实用性与易用性"的稳步迭代:

  • Apache Doris 正式成为一等公民数据源
  • 数据质量稽查能力进一步完善
  • 数据集成转换更加灵活高效
  • 社区反馈问题得到及时响应和修复

未来,qData 也将继续以社区需求为导向,持续打磨数据中台能力,欢迎大家继续参与共建与交流。

相关推荐
黄美美分享3 小时前
【免费开源】多平台直播录制软件!支持 40 + 平台直播录制,附软件下载!
windows·自动化·电脑·开源软件
计算机小手15 小时前
一个带Web UI管理的轻量级高性能OpenAI模型代理网关,支持Docker快速部署
经验分享·docker·语言模型·开源软件
喵手18 小时前
Python爬虫实战:数据治理实战 - 基于规则与模糊匹配的店铺/公司名实体消歧(附CSV导出 + SQLite持久化存储)!
爬虫·python·数据治理·爬虫实战·零基础python爬虫教学·规则与模糊匹配·店铺公司名实体消岐
Aloudata19 小时前
数据工程视角:指标平台选型深度对比(BI 指标中心 vs 传统 vs Headless vs 自动化平台)
数据分析·自动化·数据治理·指标平台·noetl
ApacheSeaTunnel21 小时前
Apache SeaTunnel Zeta、Flink、Spark 怎么选?底层原理 + 实战对比一次讲透
大数据·flink·spark·开源·数据集成·seatunnel·数据同步
袋鼠云数栈1 天前
让多模态数据真正可用,AI 才能走出 Demo
大数据·人工智能·数据治理·多模态
Aloudata1 天前
数据工程成本优化:Aloudata CAN NoETL指标平台如何释放1/3+服务器资源
数据分析·自动化·数据治理·指标平台·noetl
Aloudata1 天前
金融数据治理新范式:如何用算子级血缘与主动元数据 10分 钟定位 EAST 报送异常?
金融·数据治理·元数据·noetl·数据血缘
亿信华辰软件2 天前
已经上了数据中台,还要做数据治理吗?
大数据·人工智能·数据治理