YashanDB:自主原创、行稳致远

本文为"2024国产数据库创新大会"深算院首席技术官兼崖山科技总裁陈志标的演讲实录分享,主题为《自主原创、行稳致远》,欢迎阅读。

金融行业面临自主可控与业务创新双重挑战

我们正处在百年未有之大变局中,中国的科技以前所未有的速度登上国内国际大舞台,我国的数据库也是如此。过去十年,国产数据库在党政、金融等行业进行了试点,取得了令人非常瞩目的成绩,但也充分暴露了当前国产数据库在产品和技术上的不足。目前国产替代已进入"深水区"和攻坚阶段------从试点到全面推广,从一般业务系统到核心业务系统的全面替代,规模化和核心替代是这一阶段的主要特点。我相信这是基础软件的黄金时代,只要抓住并利用好这样的时代机遇,中国一定会孵化出一批伟大的基础软件公司。

国产替代对我们而言是机遇也是挑战。以金融行业为例,我们来看一下其面临的挑战。首先,金融行业面临安全可靠的挑战。国家网络安全部门和金融行业监管部门对金融行业安全可靠等合规性提出愈加严格的监管要求。按照"能替尽替、真替真用"的原则,根据统计,全国有5000多家金融机构,有近百万业务系统需要在未来几年内完成替代。这些都意味着在安全可靠保障、用户体验不变的基础上,要投入少、替换快,也就是快、稳、省。过去靠堆机器、堆人力的业务改造方法,在规模化和核心替代的今天已经不适用。

强安全、稳保障、全兼容"零"修改、高抗压、高可用是金融行业的生命线,特别是在大压力场景下,性能和可用性必须全面对标国际标杆。

同时,金融行业也面临创新发展的挑战,行业新需求、新场景、新模式层出不穷。充分利用大数据、云计算、AI+等新技术去赋能业务创新,是金融科技的新业态。尤其是现在的AI大语言模型,从客户服务、产品研发、开放生态等多个方面,将从根本上重塑金融行业,这也对数据管理提出了更高要求。

如何满足金融行业安全可控和创新发展的诉求?我认为今天的我们一定要找到更经济、更普适的规模化替代方案,作为国产数据库,一定要做到能真正对标且超越国际巨头。

崖山之志 崖山之人 崖山之道 对标国际巨头的底气

崖山之志。"立崖山之志,补科技之断层",这句话从一开始就在我们实验室的墙上,打造国际领先的中国数据库系统是我们的初心。有不少朋友对"崖山"的名字来由感兴趣,它是我院首席科学家樊文飞院士亲自命名,取自南宋著名的保家卫国战役崖山海战,10万军民以死殉国,知其不可为而为之,以生命坚守华夏民族气节、风骨。我们知道,在国内做基础软件很难。我们做崖山也是明知其不可为而为之,希望为华夏民族的软件事业坚守气节和风骨,打造中国原创数据库民族品牌。

崖山之人。在市场化推广时,很多朋友好奇崖山成立短短几年,为什么能从零做出100%自研的数据库产品,还能突破共享集群等塔尖技术。我的回答是:关键在于人,在于团队。崖山的最大竞争力在于我们具有不可复制的人才团队,这里聚集了许多天才横溢的基础研究专家,也聚集了许多坚持板凳要坐十年冷的数据库内核工匠,大家放弃了外部优厚待遇,只为崖山之志聚集在深算院,打造属于中国人自己的数据库产品。

崖山之道。我们一直在坚持全自研路线,践行长期主义。通过原创理论的研究、根技术的突破以及系统工程能力的持续积累,实现"三位一体"全方位突破。在基础理论方面,过去五年我们发表了108篇论文,其中属于CCFA类96篇,属于数据库四大数据库国际顶会论文65篇;当然,这些研究成果不只是停留在论文层面,而是直接解决工业界在工程实施过程中遇到的问题,目前有超过60%已经在系统中应用,共申请知识产权超过200项。

在根技术突破方面,基于有界理论突破的有界加速技术,将大数据变小,实现大数据分析性能数量级提升。在架构层面突破共享集群"塔尖"技术,在具备金融级高可用能力的同时有优异的性能表现,4个节点可以提供超500万tpmC的处理能力,完全具备为核心业务系统提供与国际标杆1比1平替的能力。

在工程实现能力方面,我们坚持每年近2亿的研发投入,践行软件研发IPD流程,将不确定性的软件研发最大确定性化;采用3层质量保障体系,有近百万级自动化测试用例,300多台物理服务器7*24小时不间断测试、运行等等,这些都是为了提供高品质产品所做的工程,也是崖山对标国际巨头的底气。

1:1平替 规模化替代的新解法

我们致力为核心业务提供国产替代更优选,实现"三不变、两对等、一更优"是YashanDB1:1平替方案最核心的价值主张。 "三不变"------即应用不变,高度兼容Oracle,一键式迁移,无需业务额外改造;架构不变,采用共享集群架构,行业最佳实践;运维不变,直接复用国内超20万Oracle DBA生态,人才获取成本大大降低,学习成本也非常低。"两对等"------首先是性能对等,在大压力场景下,业务体验不会下降;二是可用性可靠性对等,采用两地三中心,数据不丢失,业务不宕机,可以让运维人员睡个"安稳觉";"一更优"------100%自研可控,100%满足安全可靠要求。

我们测算了一下,相对于业务改造,YashanDB1:1平替方案能释放50%以上的成本,预计每年可以为全社会节省数百亿的计算资源和人力投入,让更多的资源可以投入到业务创新,让中国企业更好地参与到国际竞争当中。

全链路数据管理 使能业务创新发展

面向"新质生产力"的高质量转型,YashanDB基于原创理论在HTAP、多模融合以及关系、图、向量融合分析方面实现技术突破与布局。深算院除了崖山之外,还有另外两款产品,提供"一体两翼"全链条数据管理解决方案------采石矶数据质量系统解决数据质量问题,崖山数据库管理系统YashanDB解决数据的存、算、管的问题,钓鱼城数据分析系统解决数据的使用问题,助力企业更简单地用好数据,实现数据普惠。

立足当下,YashanDB想通过真正的1:1平替方案来解决现在面临的核心替代难题,节约社会成本;面向未来,我们希望YashanDB使能业务创新,更好地释放经济效益。

民族英雄文天祥有两句诗广为人知,"人生自古谁无死,留取丹心照汗青",这首诗叫《过零丁洋》,是他在广东目睹崖山海战之后写的,还有另外两句"惶恐滩头说惶恐,零丁洋里叹零丁"。我们希望能够致敬先贤,做到"惶恐滩头筑数据底座,伶仃洋侧扬华夏威名"。

自研、高端、根技术,这就是崖山给出的答案。

相关推荐
边缘计算社区19 小时前
吉快科技荣膺“金边奖·最佳大模型一体机”,引领AI边缘新时代
人工智能·科技
因_果_律19 小时前
亚马逊云科技 re:Invent 2024重磅发布!Amazon Bedrock Data Automation 预览版震撼登场
大数据·人工智能·科技·亚马逊云科技·re invent
IT信息技术学习圈20 小时前
强基计划之编程:开启科研精英培养新路径
科技·强基计划
嗯? 嗯。2 天前
嵌入的律动,科技的心跳
科技
合合技术团队2 天前
高效准确的PDF解析工具,赋能企业非结构化数据治理
人工智能·科技·pdf·aigc·文档
标贝科技2 天前
标贝科技受邀出席2024ADD数据应用场景大会 共议数据要素发展新契机
大数据·数据库·人工智能·科技·语言模型·数据挖掘
cosgum2 天前
远程医疗:科技助力健康触手可及
服务器·网络·科技
2402_857583492 天前
科技赋能医疗挂号:SSM 医院预约挂号系统的 Vue 卓越设计与达成
vue.js·科技·mfc
最新快讯2 天前
科技快讯 | 中国版星链正式升空;美团:已在部分城市试点优化疲劳管理机制;OpenAI开放满血o1模型API 成本暴降60%
人工智能·科技
河南查新信息技术研究院2 天前
科技查新对专利申请有什么帮助?
大数据·科技·全文检索