作为基础软件“三驾马车”之一,数据库是支撑信息系统安全稳定运行的重要保障。记者从日前在京举行的openGauss Summit(开源高斯峰会)获悉,2023年国产数据库openGauss系新增市场份额达21.9%,标志着openGauss已跨越生态拐点,这对于保障数据安全、产业安全具有重要意义。
打造数据基石 筑牢安全防线
在以“汇聚数据库创新力量,打造千行万业数据基石”为主题的此次峰会上,国际市场调研机构弗若斯特沙利文发布《重点行业数据库应用调研报告》指出,2023年中国数据库市场线下集中式openGauss系新增市场份额达21.9%,已规模应用于金融、政府、电信、能源、制造、公路水运、邮政、教育等十大关键行业核心场景。这标志着openGauss已跨越生态拐点,正式踏入生态发展期。
数据存储是数据安全的最后一道防线,其中数据库系统作为承载数据存储和计算功能的专用软件,是各企业数据工作流程的核心,是助力数据价值释放的核心引擎。数据库也是三大基础软件之一,但该领域长期以来存在过度依赖国外主流数据库产品的现象。
“数据安全技术的突破,不仅需要科学界解决密码学、共识算法等难题,同时需要与应用场景、基础软件等相结合,以便在千行百业落地,保证国计民生重要数据的全生命周期安全。”中国科学院院士王小云在致辞中表示。
国家工业信息安全发展研究中心软件所所长潘妍也认为,新形势下持续提升我国数据库的技术水平和供给质量,实现高质量发展,对于推动我国信息技术产业向产业链的上游、价值链的高端转型,保证重点产业链安全具有重大意义。面对国际环境变化和产业链的重构重塑,过去国产数据库在国外开源技术的基础上做规模的发展模式亟待改变。
早在2020年6月,华为宣布开源数据库能力,开放openGauss数据库源代码,并成立openGauss开源社区。三年多来,如今openGauss社区已经汇集了6100多名核心贡献者,超过570家知名企业和学术机构;全球版本下载量超230万,覆盖全球118个国家和地区、1519个城市,开源代码达2100万。在国内最大的开源代码共享社区Gitee上,openGauss已成为最活跃的开源数据库根社区。
openGauss社区理事会理事长胡正策表示,打造安全、稳定的数据库考察的首先是工程能力,而华为积累30多年的产品研发质量管理和安全可信能力、软件工程能力都充分内化到研发基础设施中,openGauss社区基础设施继承了这些平台能力,可以保障社区提交代码的基础质量,做到安全可信。在安全技术上,openGauss打造了理念和竞争力均领先业界的全密态数据库,确保数据在传输、计算和存储整个过程中都是全程加密,最大限度保证数据的隐私和安全。
北京海量数据技术股份有限公司是最早加入openGauss生态的企业之一,公司总裁肖枫介绍:“在加入openGauss社区前,我们面临国外数据库带来的一些协议安全性上的问题,而openGauss的出现创造了一个全国产的开源环境,极大程度上消除了安全方面的隐忧,提供了一个安全可靠的发展环境。”
聚焦根技术 汇集创新力量
随着数字化转型深入推进和数据量爆炸式增长,应用需求变化推动数据库技术创新,加速全球数据库产业发展。
此次峰会上,中国软件行业协会正式发布《中国软件根技术发展白皮书(数据库册)》,倡导国产数据库技术收敛路线,鼓励产业上下游生态链资源联合起来,共同打造具有国际竞争力的国产数据库技术、产品和解决方案,推动我国数据库产业高质量发展。
中国工程院院士郑纬民表示,中国数据库行业进入高速发展阶段,openGauss已在国计民生行业规模商用,成为行业首选的国产开源数据库。国内数据库社区进一步可持续发展需加强数据库核心技术研发,建立完善的国产开源数据库生态,打造植根于国内的开源数据库根社区,加强专业数据库技术人才培养。
潘妍则建议,要着力攻克核心技术的卡点短板,加强新型数据库研发布局,强化应用场景的牵引,并打造优质的骨干企业,培育一批数据库龙头企业和创新型的中小企业,形成多层次梯队化的创新主体和合理的产业布局,提升全产业的竞争力。
华为鲲鹏计算业务总裁李义强调,华为公司将持续投入openGauss社区建设,聚焦根技术创新,与产业界共同打造坚实的基础软件根基,携手全产业链推动数据库创新,共建数据库根社区,产研联合,产教融合,积极推动产业人才培养。
随着openGauss在各行各业规模应用,涌现出大批优秀的创新实践。在openGauss社区联合国家工业信息安全发展研究中心、携手业界专家学者共同评审出的13个2023年度openGauss标杆应用实践案例中,包括邮储银行、民生银行、兴业银行、中国移动、中国联通、京东、国网江苏电力、京东方等行业头部企业的核心业务创新实践,为推动产业技术创新、促进形成规模化应用起到了示范带动作用。
人才是产业发展的基础。openGauss联合全国高校推出“基础软件百校种子计划”,已与300多家高校联合开设openGauss课程,培养500多位优质师资,40000余位技术人才。
面向AI时代 打造超级外脑
中国计算机学会常务理事、华东师范大学数据学院教授周傲英表示,随着数字化转型的不断深入,生产力逐渐数字化,数据库作为数据技术软件体系的核心也在不断演进。AI时代来临,数据库如何赋能AI训练和推理,AI如何赋能数据库,这是每个数据库开源社区和厂商需要思考的问题。
“随着AI应用达到奇点,数据库从辅助应用逐渐深入生产核心系统。企业的垂域知识、增量知识,需要以向量化的方式高效存储,从而解决大模型落地应用时的数据隐私和知识更新问题。数据库作为关键使能器和加速器,将成为大模型的超级外脑。”胡正策认为,数智时代奔涌向前,数据库要更快、更强、更智能。行业数智化的加速,带来数据规模高速增长,尤其是非结构化数据呈指数级增长。关系数据库要满足支持多模数据类型、多种形态部署;支持多样性的智能算力,做到算力融合调度;同时通过系统性的架构创新,实现对高维数据的高效处理。
胡正策介绍,作为面向数据基础设施的开源数据库,openGauss坚持用户场景驱动,持续进行架构创新,持续围绕数据库内核高性能、高可用、高智能、高安全,突破关键根技术,构建内核全方位竞争力。未来,openGauss将进一步升级架构及内核。在架构方面,DataPod原生支持多机并行分析、提升复杂查询性能;支持基于存储硬件的日志同步复制,实现同城双集群容灾,实现金融级集群高可用;DataKit也将实现对数据库集群安装即最优、支持数据库迁移更平滑、支持基于专家知识库的故障诊断。在内核方面,DB for AI升级为支持向量引擎,从支持简单的机器学习应用,升级为支持大模型应用;AI for DB将融合大模型和DataKit插件化架构,实现从GUI操作升级到自然语言交互、从自动化解决单点问题进化为自主解决系统性问题。
目前,openGauss已有17家发行版伙伴、8家OGSP伙伴、4家一体机伙伴。本次峰会上,社区联合金融行业客户及伙伴打造的首个行业版本openGauss Fintech正式发布。同时,6家伙伴联合发布基于openGauss的数据库发行版,将更有效地支持千行万业数字化转型。
“第一,我们做的是产业生态,区别于其他同行做的是产品生态;第二,我们有全栈的创新力量,这是openGauss最核心的两个区别点和竞争力。”胡正策说。(记者 吴蔚)