杭州奥零数据科技 “2025全年度数据中台产品总结报告”

官网(更新):http://www.aolingdata.com

项目:https://github.com/alldatacenter/alldata

截至2025 年 12 月 31日,市场与销售中心汇总数据显示,近乎 150+客户在过去的 365 天内对奥零数据中台进行全方位的调研,其中客户演示会议达 100+。我们有理由相信,基于开源+商业版的双链路服务,可以让更多客户使用AllData数据中台。目前我司核心产品研发中心进入了年底收尾和发版工作。

我们奥零数据目前发展是开源和商业双发展的模式,做的更多是微服务和数据底座与框架适配。这一块最终目的是让客户公司能低成本和低上手难度地用上业界主流+国产+优秀成熟稳定的大数据组件。截止目前项目部署和使用很快上手,开源版是旧版架构,功能在7-10个以内。商业版核心是微前端框架+后端的唯一可插拔架构底座+近乎齐全的大数据组件源码级适配与版本改进,功能在22-30以内。

奥零数据科技的这套数据中台解决方案是基于 6 年多开源与商业社区凝练的理念进行建设,这个理念是多框架和高度灵活的定制,才能满足客户公司既要也要又要全要的需求。没错,就是如此简洁的、令人易懂和理解的理念。

目前开源AllData数据中台28+个技术社区群/3500+人次/2900+stars/近150+的客户使用。开源项目AllData是40+社区团队维护,商业版ScienceMoat是奥零数据科技公司架构师团队维护。目前还是做更多的集成、政务客户的国产化、数据入表、数据资产化利用。

展望未来5-10年,大数据技术栈仍然会持续高速迭代与版本更新,我们所做的归根结底还是一件事,一个环节,一个可定义的数据中台。最终产品呈现结果是接入更多成熟+国产化基础设施(包括服务器/操作系统/cpu/数据库/大数据组件),助力更多政务公司实现数据资产入表。

后续持续深入做3+中台的能力底座: 1. 大数据data中台、2. 人工智能ai中台、3. 大模型llm应用中台。核心 10+新功能即将陆续发布:

1. 技术架构更新迭代:全链路数字化底座重构

AllData数据中台在2025年完成核心架构升级,采用Wujie微前端框架与可插拔后端架构,实现模块化部署与动态扩展;

通过集成TIS、Seatunnel、DataSophon、CloudEon、Cube-Studio等开源组件,构建云原生技术栈,支持容器化运行与弹性扩缩容,通过容器化部署将数据同步时效从小时级压缩至秒级。

2.数据集成能力突破:多源异构数据统一治理

● 数据库同步平台,实时同步性能跃升

集成DBSwitch项目后,数据同步速度达500GB/小时,效率大幅提升,支持MySQL、Oracle、ElasticSearch等100+数据源无缝接入,并兼容达梦、人大金仓等国产数据库。

● 智能化数据中枢平台

通过DataCap项目深度整合,数据中枢平台DataCap可实现跨系统数据流转的自动化协调。

● 湖仓一体化平台

基于Amoro核心技术,融合Flink流处理与Spark批处理,构建统一数据接口,支持Iceberg、Paimon、Hudi等混合数据湖格式,满足复杂场景需求。

3. 数据治理体系升级:从合规到智能的跨越

● 元数据管理平台,全生命周期管理

集成OpenMetaData项目,元数据管理平台OpenMetaData提供数据血缘分析、自定义元数据扩展及可视化数据地图。

● 数据质量平台,管控引擎

内置DataVines平台,数据质量平台DataVines支持字段完整性、格式合规性等百余类校验规则,结合智能阈值算法实现毫秒级异常预警。

● 标准化语料资源池

构建多模态数据集(文字、图片、音视频),打造高质量代码、科学文献等专业知识库,为AI模型训练提供标准化输入。

4.AI与机器学习平台:从工具到生态的进化

● 机器学习算法平台

集成Cube-Studio项目,覆盖数据处理、模型训练、自动调参全流程,支持分布式计算。

● 大模型应用开发平台

集成BISHENG项目,降低LLM开发门槛,支持企业快速构建智能客服、风险评估等场景应用。

● 数仓建模平台

集成开源项目Kylin建设自动化智能建模平台,结合历史数据训练销售预测、库存需求等场景模型。通过分析历史销售数据、库存数据、市场趋势数据等,构建预测模型,为企业提供销售预测与库存优化建议。

5. 低代码开发

提供拖拽式界面设计,业务人员可自助完成数据分析看板开发,无需编写代码。并提供丰富的可视化组件(如图表、表格、地图等),用户可通过拖拽组件的方式快速搭建数据分析看板。


1.AllData数据中台v1.4.1版本预发布:全链路性能跃升

1.1 性能指标突破

查询响应时间从2-5秒压缩至200-500毫秒,并发处理能力从1000提升至10000,资源利用率从60%优化至85%。

其技术实现主要基于以下优化:查询引擎优化:采用列式存储与索引技术,加速数据查询速度。同时,优化查询计划生成算法,减少不必要的全表扫描,提高查询效率。

并发处理优化:通过分布式锁与事务管理机制,确保高并发场景下的数据一致性与完整性。同时,采用线程池技术,合理分配系统资源,提高并发处理能力;

资源调度优化:基于Kubernetes的动态资源调度算法,根据业务负载自动调整计算资源,避免资源浪费与资源不足的情况发生。

1.2 安全增强特性

字段级加密:基于国密算法实现数据传输与存储加密,确保数据在传输与存储过程中的安全性。同时,支持加密密钥的动态轮换,提高加密的安全性;

细粒度权限管理:支持数据库、表、字段级权限控制,企业可根据员工角色与职责分配不同的数据访问权限,确保数据的安全性与合规性;

审计日志追踪:完整记录数据操作轨迹,包括数据查询、修改、删除等操作,并记录操作时间、操作人员、操作IP等信息。提供审计日志查询与分析功能,方便企业进行合规审计与安全监控。

1.3 信创国产化支持

软件部署支持国产操作系统:麒麟OS、国产CPU: 飞腾,国产数据库:OceanBase。同时数据集成平台支持集成达梦国产数据库+人大金仓数据库的数据到数仓Doris,助力企业构建自主可控数据基础设施。通过与国产操作系统与数据库的兼容性测试与优化,确保AllData数据中台在国产环境下的稳定性与性能。


1.新功能模块上线:从数据治理到价值变现


1.市场拓展

客户规模突破

服务客户超150+家,覆盖互联网、央国企、工业制造、医疗等15个行业。通过为不同行业客户提供定制化的数据中台解决方案,满足客户多样化的业务需求,提升客户的数据价值挖掘能力与业务竞争力。

开源生态共建

GitHub项目获2.9k+ Star,社群成员超3500人,集成Apache DolphinScheduler(工作流调度平台)、Apache Seatunnel(数据集成平台)等顶级开源项目,推动数据中台技术普惠化;

通过开源社区的力量,吸引更多开发者参与项目开发与贡献,不断优化产品功能与性能,同时为企业提供更多的技术选择与解决方案。

2.对外宣传

● 2025年08月08日"AllData数据中台v1.4.1版本发布会"


1.产品技术升级方向

AI原生架构重构

将大模型能力深度融入数据中台各模块,实现自然语言交互式数据查询、智能异常检测等功能。

隐私计算集成

支持联邦学习、多方安全计算等技术,满足金融、医疗等高敏感行业数据协作需求。

边缘计算扩展

推出轻量化边缘节点,支持物联网设备数据实时处理,降低云端传输延迟。

2025年是AllData数据中台从技术突破到生态繁荣的关键一年。展望2026年,我们将以"数据智能赋能千行百业,为企业提供全链路数字化解决方案",携手客户与合作伙伴,共同开启数据驱动的智能化新篇章!

相关推荐
2501_943695335 小时前
大专市场调查与统计分析专业,怎么辨别企业招聘的“画饼”岗位?
大数据
七夜zippoe5 小时前
CANN Runtime跨进程通信 共享设备上下文的IPC实现
大数据·cann
威胁猎人6 小时前
【黑产大数据】2025年全球电商业务欺诈风险研究报告
大数据
L543414466 小时前
告别代码堆砌匠厂架构让你的系统吞吐量翻倍提升
大数据·人工智能·架构·自动化·rpa
证榜样呀6 小时前
2026 大专计算机专业必考证书推荐什么
大数据·前端
LLWZAI6 小时前
让朱雀AI检测无法判断的AI公众号文章,当创作者开始与算法「躲猫猫」
大数据·人工智能·深度学习
JustHappy6 小时前
「web extensions🛠️」有关浏览器扩展,开发前你需要知道一些......
前端·javascript·开源
SickeyLee6 小时前
产品经理案例分析(五):电商产品后台设计:撑起前台体验的 “隐形支柱”
大数据
callJJ7 小时前
Spring AI 文本聊天模型完全指南:ChatModel 与 ChatClient
java·大数据·人工智能·spring·spring ai·聊天模型