作者:苏中 阿里研究院资深技能研究专家
“2021年5月20日,从国际数据库领域威信组织TPC(Transaction Processing Performance Council)传来好,阿里巴巴公司自主研发的数据库产品OceanBase以1526万QphH的性能总分冲破TPC-H 30000GB的历史记录,拿到了OLAP(在线剖析处理)天下第一。2019 年和2020年,OceanBase曾两次登顶天下OLTP(在线交易处理)TPC-C 基准性能测试。这意味着OceanBase成为数据库领域唯一在事务处理和数据剖析两个领域的国际技能评测中都拿到第一的中国自研数据库。”
数据库也可能被卡脖子

2018年4月16日,时任美国商务部部长的罗斯敕令,禁止美国公司向中国电信设备制造商复兴通讯出口电讯零部件产品。一韶光,这家正准备为5G市场捋臂将拳的电信设备制造巨子一下被卡住了脖子,从产品研发到设备生产险些全线休克, 企业险些停摆。
三天后,《科技日报》在头版头条推出题为 “亟待占领的核心技能”专栏,系统刨析我国关键核心技能的短板,引起了举国高下,尤其是科技界巨大的反响。“卡脖子专栏”先后列举了35个“卡脖子”技能,商用数据库管理系统(DBMS),即数据库技能,位列个中。
数据库的简要发展史
1970年,IBM圣何塞研究实验室的研究员埃德加·科德揭橥题为《大型共享数据库的关系数据模型》的论文,第一次提出了关系数据库模型,办理了当时运用开拓中极其繁芜的数据管理、利用和共享的问题,为打算机科学打开了一个崭新的技能领域。科德也因此得到1981年的图灵奖。科德可能没有想到的是,数据库软件如今已经发展成为每年500亿美元规模的市场,从查询景象预报、预订共享出行、网购商品到各种在线做事,数据库软件险些支撑着我们身边的每一项信息做事。
目前,商用领域的数据库软件险些被Oracle, Microsoft, IBM,teradata等美国公司垄断。
阿里自主数据库之路,始于开源框架的探索
韶光回到2003年,伴随着阿里新成立淘宝业务快速发展,阿里在数据库研发的投入开始加速。为了相应高速增长的业务需求,淘宝乃至启用了全亚洲最大的Oracle RAC集群。不过,性能瓶颈和本钱压力还是让数据库系统成为了淘宝业务发展的难点。
和同时期的其他互联网公司类似,阿里自主开拓数据库系统的道路开始于搭建基于开放源码数据库系统的自研数据库平台。在开源数据库项目MySQL之下,阿里技能团队构建了一个分支叫AliSQL,投入研发力量不断优化系统性能和实现新的功能。2016年云栖大会上,阿里云宣告AliSQL开源,比较社区版MySQL, AliSQL有70%性能提升,在支持秒杀场景的情形下,性能乃至有百倍的提升。
云原生给数据库技能自主发展带来了新的历史机遇
随着互联网尤其是移动互联网技能的发展,IT技能进入了大数据的时期。数据库技能也从集中式平台发展到分布式技能。随着云时期的快速到来,依托云原生技能的分布式数据库技能带来了数据库技能发展带来新的技能革命。云原生将系统资源解耦池化并支持资源分布式水平扩展能力,同时云原生数据库通过将存储与打算分离,实现了传统数据库达不到的打算弹性以及系统韧性。特殊是云原生技能实现了数据库的打算剖析一体化,办理了传统数据库做OLTP(在线交易处理)和OLAP(在线剖析处理)须要用利用两套不同的技能方案、并在两套系统中耗费大量的资源做数据迁移的缺陷。
云原生数据库OceanBase
2010年,在开源分布式运算框架Spark项目开源公布的同一年,阿里成立了OceanBase项目组,目标便是成为云原生分布式数据库的领跑者。
OceanBase的商业化道路一步一个脚印。2014 年,OceanBase 支撑了当年双 11 的峰值,实现了核心业务交易场景零的打破。2017 年,OceanBase 第一次走出阿里巴巴,南京银行成为第一家外部客户。如今,OceanBase已经在多家机构落地运用,帮助企业实现数字化转型。正如本文开头来自TPC的好那样,OceanBase在业内不断得到国内外同行肯定。
技能评测中都拿到第一的中国自研数据库。
从科德的论文揭橥至今,数据库技能已走过50多个年头。正如无线通讯技能经历过5个技能阶段的发展,如今在向结合卫星通讯的6G技能演进中一样,数据库技能在云打算时期也在飞速演进,中国必将迎来自研数据库百花齐放、群星残酷的时期。
责编:斌卡(转载及媒体互助请留言区留言)