数据库内核月报

众所周知，POLARDB 核心的技术是使用 InnoDB Redo Log 物理复制替代了 MySQL 原生的 Binlog 逻辑复制，并且在物理复制的基础上构建了一写多读的共享存储架构。物理复制相比于逻辑复制有很多优点（参考月报），但是 Binlog 逻辑日志是 MySQL 生态中重要的一环，如果说数据库让用户的数据 ‘在线’，那么 Binlog 日志可以让在线的数据准实时的流动，例如实时同步到下游做自建备库，分析数据做业务报表等等。虽然物理复制能够更好地满足云原生数据库的架构，但并不能取代逻辑日志的生态，那么如何解决两种不同类型日志的协同，即满足产品架构的演进又兼容开源的生态，就成为一个难题。

图1是目前共享存储的架构，实线表示 Redo Log 流，虚线表示 Binlog 流。集群内部 Redo 负责同步数据到 RO 和 Standby(灾备节点), Binlog 可以实时被用户拖走，同步到 Standby 并不应用，只是保留在本地。这个架构下大部分的灾备场景只需要切 RO 节点，在共享存储上可以保证两种日志的一致。Standby 的切换一般用于存储升级等场景，大部分都是 Plan Failover, 同样可以保证一致性。

图2是 GDN 的架构(官网介绍)，两个集群通过 GDN 网络和 Redo 日志流同步两个 AZ 之间的数据，实际上类似于图1的 RW 和 Standby 间的复制。这种架构下，要满足跨 AZ 的容灾，同样如果是 Plan Failover 可以保证两条日志流一直，但是 Unplaned Failover 两条流各自复制，切换后的一致性很难保证。

图3是三节点的集群增强版，使用 Redo + Xpaxos 保证三 AZ 的高可用，这种架构下的角色切换，都是 Unplanned Failover, 两条流的一致性无法保证。

为了解决上述问题，我们提出了 Logic Redo 的方案，目标是以开源 Binlog 日志格式为基础，让 Innodb Redo Log 拥有提供逻辑日志服务的能力。

Logic Redo

两种日志除了存储格式，组织方式不同，最大的区别在于 Redo 是细粒度的状态日志，记录了引擎中 Page 等数据变化的每个状态，而 Binlog 是提交日志，以事务为粒度。即使使用了物理复制技术，Redo 也并不会被用户访问，只在集群内流转，但是 Binlog 实际上是一种服务，会不断有用户去读取。

要把两条流合一，新的日志会同时兼具原本两种日志的特性，可以在内部流转，也可以被用户读取，能吐出 Page 状态的数据变化，也能吐出事务粒度的状态日志。

我们的解决方案是把 Binlog 转成一种 Redo Log Type，有序的写入 Redo Log 中，日志类似于：

在原本两阶段提交中出现的性能瓶颈在 Binlog In Redo 中已经分析清楚了，在串行阶段的两次 fsync 会对性能有较大的损失，其实引擎 Prepare 的持久化也是在 Redo 里，当作为协调者的 Binlog 也记录在 Redo 之后，一份日志流的顺序性，就可以去掉引擎阶段的 Prepare 状态持久化。在 POLARDB 里，由于存储分离有高延迟高吞吐的特性，可以获得 20% ~ 50% 的性能提升。

架构

写入部分

可以看到在 Ordered Commit 阶段去掉了一次 Sync Redo 的操作，为了保证兼容性，我们仍然保留了 Binlog 文件，但是文件中实际上已经不记录任何 Binlog 数据了，只是记录一些元信息，例如文件大小，Timestamp，Encryption，LSN 和 Offset 的映射等。这些在例如 show binary logs 等命令中需要用到，同时读取真正数据的时候，也需要从 Offset 找到对应的 LSN 位置。

读取部分

上面提到 Binlog 的一个比较大的优势是可以非常低的延迟把数据吐给下游，为此我们做了类似 Buffer Pool 的设计，Runtime Binlog Sys 可以实时的把需要读取的 Binlog 文件从 Redo 中读取并解析出来，放到内存里，根据 Dump 线程的读取特点，有一套预热和淘汰的机制，这样可以更加细粒度的控制数据，而不会过度依赖文件系统的调度。

性能

在 Sysbench write only 场景下，开发机模拟计存分离的环境简单对比了性能作为参考。

总结

日志合流之后最显著的就是存储空间问题，这个将来会配合日志上传，及时做归档，并且从实际测试来看，日志量变大后对复制延迟影响不大。Logic Redo 作为业内开创性的工作，解决了双日志同步的问题，并且在这种架构下，原本的 XA 崩溃恢复，Binlog 管理，性能优化等等问题都有了全新的视角和解决方式。首先将在三节点集群增强版中使用，敬请期待。

数据库内核月报－ 2021 / 07

POLARDB · 引擎特性 · Logic Redo

相关工作

Oracle Logic Standby

InnoDB Redo 转 SQL

AliSQL Binlog In Redo

Aurora Binlog Optimize

Logic Redo

架构

写入部分

读取部分

性能

总结