qData 数据中台开源版 1.1.2 版本更新公告:新增 Apache Doris 数据源全面支持,稽查规则与转换组件持续完善

在数据中台的实际使用过程中,我们持续关注社区用户的真实反馈与使用场景。

本次 qData 数据中台开源版 1.1.2 更新,围绕 数据源扩展、数据质量能力增强、数据集成易用性提升 三个方向进行了集中优化,并修复了社区中反馈的若干问题。

下面为大家带来本次版本的详细更新说明 👇


一、更新背景

1️⃣ Apache Doris 使用频率持续上升

在社区和用户实践中,我们发现 Apache Doris 作为高性能分析型数据库,被广泛应用于实时数仓与分析场景。

因此,qData 开源版在本次版本中正式将 Apache Doris 纳入核心数据源体系,并实现多模块全面支持。

2️⃣ 数据稽查规则持续扩展

随着数据质量治理场景的不断丰富,原有稽查规则已无法覆盖全部业务需求。

本次更新对稽查规则进行了扩展,增强了对时间逻辑、字段完整性等典型场景的支持。

3️⃣ 数据集成转换能力进一步增强

在数据集成任务中,用户对"灵活处理数据"的需求越来越高。

因此,1.1.2 版本新增多种常用转换组件,让数据处理过程更加顺手、直观。

4️⃣ 社区反馈问题集中修复

感谢社区用户的持续反馈 🙌

本次版本同步修复了多个已在社区提交的 Bug,进一步提升了系统稳定性与使用体验。


二、核心更新内容一览

1️⃣ Apache Doris 数据源全面支持

本次更新中,qData 开源版已在多个核心模块中支持 Apache Doris 数据源:

  • 数据连接

    • 新增 Apache Doris 数据源类型,支持统一配置与管理
  • 数据查询

    • 支持基于 Apache Doris 的数据查询能力
  • 数据集成任务

    • 表输入组件支持 Apache Doris
    • 表输出组件支持 Apache Doris

这意味着,用户可以在 qData 开源版中完成 从 Doris 到 Doris、或 Doris 与其他数据源之间的数据集成与治理,覆盖更多实时分析与数仓场景。


2️⃣ 新增数据稽查规则

为满足更复杂的数据质量校验需求,本次新增以下两类稽查规则:

✅ 时间字段顺序逻辑校验
  • 检查多个时间字段之间是否存在逻辑上的先后关系

  • 适用于:

    • 开始时间 / 结束时间
    • 创建时间 / 更新时间
    • 业务流程时间链路校验等场景
✅ 字段组完整性校验
  • 校验字段组合在全表范围内是否唯一

  • 常用于:

    • 联合主键校验
    • 业务唯一性约束检测

3️⃣ 新增数据转换组件

在数据集成任务中,1.1.2 版本新增多种高频使用的转换组件:

  • 去除重复记录组件

    • 支持基于指定字段进行去重处理
  • 常量转换组件

    • 为字段赋固定值,简化规则类处理逻辑
  • 字段选择 / 修改组件

    • 灵活控制字段的保留、重命名、调整
  • 值映射组件

    • 支持将字段值按规则进行映射转换
    • 适用于编码转换、状态值标准化等场景

这些组件的加入,使得数据集成任务在不依赖外部 ETL 工具的情况下,也能完成更复杂的数据加工逻辑。


4️⃣ 社区 Bug 修复

本次版本同步修复了以下社区已反馈问题:

感谢社区用户的积极反馈,帮助 qData 变得更稳定、更好用 ❤️


三、版本总结

qData 数据中台开源版 1.1.2 版本是一次围绕"实用性与易用性"的稳步迭代:

  • Apache Doris 正式成为一等公民数据源
  • 数据质量稽查能力进一步完善
  • 数据集成转换更加灵活高效
  • 社区反馈问题得到及时响应和修复

未来,qData 也将继续以社区需求为导向,持续打磨数据中台能力,欢迎大家继续参与共建与交流。

相关推荐
ClkLog-开源埋点用户分析17 小时前
在信创环境下,如何判断一套用户行为分析系统是否“真正可用”?
数据分析·开源·开源软件·用户画像·埋点系统
CoderIsArt19 小时前
类comsol的开源软件
开源软件
Alex艾力的IT数字空间1 天前
大模型的“Think 模式”(思考模式)关闭的配置方式
人工智能·机器人·web3·github·开源软件·量子计算·开源协议
好运的阿财2 天前
OpenClaw工具拆解之browser+agents_list
前端·人工智能·机器学习·开源软件·ai编程·openclaw·openclaw工具
RestCloud3 天前
零售行业全渠道数据整合:ETL工具如何支撑精准营销?
数据仓库·etl·零售·数据处理·数据集成·数据传输·数据同步
Teable任意门互动4 天前
多维表格哪家最好用最容易上手?国产开源 Teable 测评
开发语言·数据库·开源·excel·飞书·开源软件
Days20506 天前
免费短视频去水印解析下载移动端
人工智能·开源软件
科技小花6 天前
测评|2026五大数据治理平台横向对比:谁在定义数据中台的“智能引擎”?
大数据·数据库·人工智能·数据治理·数据中台
Hui_AI7206 天前
保险条款NLP解析与知识图谱搭建:让AI准确理解保险产品的技术方案
开发语言·人工智能·python·算法·自然语言处理·开源·开源软件
科技小花7 天前
2026年数据治理出海:当“全球化运营”遭遇“数据治理壁垒”,谁能提供答案?
网络·人工智能·数据治理·全球化·出海