分布式|面向未来,分布式数据库能有哪些新的突破( 三 )


技术路径OceanBase 自 2010 年立项以来,已经过了 11 年,一直保持着不断的突破和创新。同样的,分布式数据库也经历了三次技术迭代,从最早的 NoSQL 系统走向今天的原生分布式数据库。

  • 第一代分布式数据库是一个分布式的存储系统,也被称为 NoSQL。
  • 第二代分布式数据库采用搭积木的方式,在 NoSQL 的基础之上引入了 SQL 的支持,支持基本的 SQL 功能,但是往往都牺牲了单机的性能和成本。
  • 第三代原生分布式数据库,追求极致,支持完整的企业级 SQL 功能,并且做到单机性能与集中数据库基本相当。
OceanBase 十一年以来一直坚持自主研发,秉持只有自主研发才能完全掌控内核,只有完全掌控内核才能够持续在原生分布式数据库领域开拓创新。所以,OceanBase 的原生分布式数据库也经历了三次迭代:
  • 第一代分布式存储系统:将 LSM 首次引入到关键数据库领域里面,大幅降低关键数据库的存储成本。
  • 第二代分布式数据库:OceanBase 再次将 paxos 协议引入到关键数据库领域里面,首次做到 IPO 等于零。
  • 第三代原生分布式数据库:OceanBase 做到在一套引擎同时支持 OLTP 与 OLAP 混合负载,并且参与 TPC-C 和 TPC-H 打榜都取得世界第一的成绩。
2021 年 OceanBase 又取得五大核心产品技术突破:
  • 从 OLTP 到 HTAP,TPC-H 整体性能提升 620%,30TB 打榜排名世界第一。
  • 单核性价比大幅提升,Sysbanch 整体性能提升 68%,支持小规格部署,性价比在全球分布式数据库领域遥遥领先。
  • 更强的跑批能力,支持超大事务,能够在一套引擎同时梳理交易和跑批两类工作负载,并且确保跑批负载不会影响正在进行的交易业务,并行 DML 和大数据导入性能分别提升 270% 和 58%。
  • Oracle 平滑迁移,OceanBase 是业内首个支持平滑迁移 Oracle 的原生分布式数据库,并且得到银行、保险、证券、运营商、公共事业等多个行业核心业务场景的应用证明。
  • 【 分布式|面向未来,分布式数据库能有哪些新的突破】易用性提升,实现了不依赖单点的分布式检测,也能够通过全链路监控来大幅降低问题排查成本。
OceanBase 也是全球唯一一个在事务处理和数据分析两个领域都获得过世界第一的原生分布式数据库。
产业进步与开源发展长期以来,数据库领域并没有太大的突破或进展,由于它本身是一个门槛比较高的行业,长期就是由几家公司来占据市场份额,所以导致很长一段时间内的开源分布式数据库发展升量很足,但是在整个市场份额上未必有优势,这是很长一段时间里整个开源分布式数据库发展的整体情况。
但是从 2021 年 1 月开始出现了一个很大的变化,在市场产品占有率层面,开源的产品第一次超过了闭源的商业产品,这是一个好的现象,同样的,分布式数据库在市场上的竞争也是日渐增长,说明分布式数据库的价值以及它的架构上的优势正在越来越被大家所认可。
OceanBase 在社区开源发展方面做的可圈可点。从数据层面来看,社区总用户 23000 名,百名外部开发者, 超百企业用户在社区进行深度的探索。在社区建设上,在 Gitee 和 GitHup上Star 数已经超过 4000 次,社区 Fork 数 860,Commit数超过 640。在最为关键的社区活跃度上,每日和用户的沟通数次数超过了 300 次,并且社区问答数迄今为止已经超过 4600 次。在技术布道方向连接了超过 3500 名开发者。这些数据表明:OceanBase 社区正在蓬勃发展,在未来将会更上一个台阶。
国外和国内对开源社区的组织形式有什么区别呢?主要有几下几点: