中信建投在金融电于化期刊发布 DataOps 实践

文 ‖ 中信建投证券股份有限公司 马丽霞 高宇航 李可 许哲 李海伟

近年来,数据的分析和应用对各行各工业的业务模式和竞争形态进行重塑,而积极应对挑战和顺应时代变化是各个市场参与者的必选项。作为资本市场数字化转型的领航者,中信建投证券重视数字化转型机遇,陆续启动了各业务领域的数字化转型建设。

DataOps 作为近年来数据管理领域兴起的工程文化和实践,借用了 DevOps 敏捷交付的基础框架,揉合了 DAMA 数据治理理念,强调在如此激烈竞争的商业环境下,最大限度地快速匹配业务部门的需求和资源开展交付,加速业务价值的试验与试错,持续实现数据价值。

为高质量服务公司数字化转型,中信建投证券于 2021 年正式启动 DataOps 能力建设,结合公司现状打造了 DataOps 研发管理创新体系,梳理优化需求、设计、开发、测试、投产的全过程及相关支撑工具的整合,逐步建立了标准化、全线上流水线,支持数据持续集成和交付,为数据供给提供效率和质量的双重保障,支撑公司数字化转型。

基于DataOps的券商数据平台与应用服务体系建设

1. 面向"汇聚共享"的数据底座

中信建投证券建设了信创化的云原生湖仓一体数据底座。该平台是将数据湖的灵活性和数仓的易用性、规范性、高性能结合起来的融合架构,是公司打造的新代数据底座,满足了数据高效汇聚、数据算力灵活扩展、资源隔离的需求。

通过建设数据底座,打破了公司数据"烟囱"壁垒,将公司内外部的数据汇聚在一起,并参考证券行业SDOM数据模型结合公司数据标准规范和实际情况,对数据进行重新清洗、整理、组织和联系,逐步形成公司级的高质量、可信的、标准化的产品、客户、机构等共性数据,为经营分析、风控等数据消费提供数据供给。

同时探索建立指标标签管理体系,在共性数据的基础上,数据底座还构建了指标标签工厂。一方面推动指标标签的定义归集 、计算(结果)归集和服务归集 ;另一方面通过解耦指标标签需求与数据开发,通过提供统一语义层,下游数据消费者可以方便地将业务语言转换为技术语言,快速实现业务服务。

2. 建设"服务化"的数据中台

搭建企业级数据能力框架,弥合数据供需鸿沟,用户不需关注数据架构和技术只需关注业务实现,快速响应数据需求数据中台服务化分为数据技术服务化和数据服务化。

数据技术服务化通过搭建数据基础能力平台,为用户提供开箱即用的数据开发能力。为此,数据中台构建了数据开发中心和数据基础服务中心。

数据开发中心 :构建统一、标准化的一站式数据开发协作平台,完成采集、建模、加工、测试、调度、发布、监控功能的整合和集成,降低数据开发门槛,提升开发运维效率。中信建投联合白鲸开源基于WhaleScheduler产品基础上打造了全栈信创化的数据开发平台,实现统一数据开发、任务编排、任务调度,更好地完成了离线批处理、实时流处理等任务,有效峰低了数据加工处理成本,真正实现精益敏捷的数据运营。

数据基础服务中心:数据中台搭建了AI、BI、图计算、OLAP、实时计算等基础服务集群,封装了对应的数据服务能力,满足各种业务场景对计算能力的要求,帮助下游系统快速构建数据应用。

"数据服务化" 体现为封装数据底座数据应用的数据接口,提供服务化的数据调用介入方式。为此,数据中台构建了数据服务中心和数据资产中心。

数据服务中心:在数据安全合规的前提下,将数据以API、文件等形式开放供业务流程调用、下游系统交换数据使用。

数据资产中心:建设数据门户,提供企业级数据资源访问入口和数据工作展示服务窗口。将数据资产目录建设为公司级的数据资产查询和操作系统,解决数据"是什么,在哪里"的问题,具备向数据服务引流的能力,支持数据应用。同时整合公司各项数据能力,打造数据工具箱,面向不同用户提供不同的数据能力服务,着力解决数据"怎么用"的问题。

3. 打造"敏捷高效"的数据产品交付中心

数据需求方面,通过"两归口"实现需求统筹管理。一方面,发挥SI制度优势由业务部门SI归口本部门数据需求,从源头上规范数据需求:另一方面,组织数据专家形成评审委员会,对重点项目重点需求开展评审,借助专家经验不断提升交付质量。

数据研发方面,通过一站式数据开发协作平台与公司DevOps持续交付体系结合起来,数据开发协作平台统一对接Gitlab进行代码托管,将各种数据任务类型构建数据研发流水线,提高数据研发效率和交付能力。同时,数据研发过程引入数据模型管控,通过对接数据模型管理工具,实现数据模型设计标准化。

CI/CD方面,数据流水线通过持续集成插件自动化进行代码规范扫描、业务规则测试、测试报告生成,满足数据测试质量要求版本后,运维人员可以一键确认和发布,极大节省了测试和运维工作量,提升了版本发布效率和成功率,实现了数据产交付的标准化规范化。数据研发流水线可以实现开发、测试和部署的多重保障降本增效,提升大规模数据需求交付能力实现数据价值快速输出。

4.面向"自助消费"的数据服务体系

传统的企业数据需求很大一部分是通过内部数据查询单的模式触发数据分析工作,由于开发人员工作排期及需求理解等问题,分析需求需要多轮迭代才能完成导致数据分析的时效性低。针对这一问题中信建投证券探索建立自主消费的数据服务体系。

从工具层面,基于数据中台打通了数据探源、整合及分析展现的整个链路构建自助分析体系,通过可视化低代码开发代替专业工具代码开发将以往的开发门槛大大降低。通过数据自助分析,业务用户可以更快速地进行数据探查和分析模型迭代,极大提高了数据分析的时效性。

从制度文化层面,持续开展数据分析师培训,帮助更多人建立数据思维。从人力资源层面,以数据中台为依托,举办数据分析师培训及作品评比比赛,通过作品评选挖掘发现潜在种子用户、种子部门逐步建立企业数据分析师团队。

5.构建"智能"数据管理与运营平台

(1)价值驱动的数据交付。倡导由数据价值驱动的数据开发运营,评估数据产品的业务价值和经济价值。企业数字化的目标是要建立长期目标和规划的,以关键项目为抓手,集中最优势的资源,攻坚克难,解决业务发展中最迫切的数智化要求。

(2)开发治理一体化。遵从源头管控的原则,积极开展数据治理并将相关动作尽量前置,并与数据的研发工艺有机结合.在数据产生阶段即开展数据治理。通过数据开发和治理的统一规划管理,推动数据汇聚和标准化,强化大数据融合分析。

(3)运营管理一体化。数据产品的强大生命力,一方面依赖于高质量的数据数据研发;另一方面通过收集和挖摇用户需求,以及实际的使用效果和反馈,不断优化迭代数据产品,将其建设为业务级甚至是公司级的重量级数据产品,实现数据运营与研发管理的协同。

未来展望

DataOps能力体系的建设是一个不断打磨、精益求精的过程,中信建投证券将在不断探索和总结中持续前行,为公司数字化转型提供更多动力和支持。

一是加强业务赋能。围绕关键数据应用和场景、数据组织,借助DataOps开展持续集成交付,提高数据仓库、数据中台等平台类工程建设的ROI,实现数据组织协作效能最大化,帮助企业实现数字化转型。

二是聚焦内功、不断进化。目前DataOps理念和方法论还在不断演进中因此,需积极对标最佳实践,完善我司DataOps体系,同时也会积极参与相关标准的制定和推广工作。

文章来源于金融电子化第355期期刊
本文由 白鲸开源科技 提供发布支持!

相关推荐
StarRocks_labs4 小时前
从InfluxDB到StarRocks:Grab实现Spark监控平台10倍性能提升
大数据·数据库·starrocks·分布式·spark·iris·物化视图
若兰幽竹5 小时前
【Spark分析HBase数据】Spark读取并分析HBase数据
大数据·spark·hbase
R²AIN SUITE6 小时前
金融合规革命:R²AIN SUITE 如何重塑银行业务智能
大数据·人工智能
绿算技术7 小时前
“强强联手,智启未来”凯创未来与绿算技术共筑高端智能家居及智能照明领域新生态
大数据·人工智能·智能家居
只因只因爆8 小时前
spark的缓存
大数据·缓存·spark
Leo.yuan9 小时前
3D 数据可视化系统是什么?具体应用在哪方面?
大数据·数据库·3d·信息可视化·数据分析
只因只因爆9 小时前
spark小任务
大数据·分布式·spark
cainiao0806059 小时前
Java 大视界——Java 大数据在智慧交通智能停车诱导系统中的数据融合与实时更新
java·大数据·开发语言
End92812 小时前
Spark之搭建Yarn模式
大数据·分布式·spark
我爱写代码?12 小时前
Spark 集群配置、启动与监控指南
大数据·开发语言·jvm·spark·mapreduce