数据库内核月报 - 2015 / 12

MariaDB · 社区动态 · MariaDB on Power8

前言

Power平台作为IBM的企业级平台,其稳定性和高效能在业界尤其是大型金融企业有着良好的口碑,MariaDB作为MySQL的重要开源分支,也对IBM Power8平台进行了适配。

很幸运我拿到了一台Power8的机器,在Linux on Power上成功编译了MariaDB 10.1版本,不过还没有拿到同规格的PC服务器用于对比,所以本期我先介绍一下MariaDB on Power的一些信息,下期月报我会拿出实测对比数据,并且分析一下MariaDB在Power平台和x86平台上关键路径的效率。

关于Power平台

与我们常见的x86平台不同,Power平台是RISC架构,而Intel的x86是CISC架构,早期的Mac也是采用PowerPC。

RISC相对于CISC,把主要的设计放在最常用的指令上,尽量使这些执行执行更加简单高效,对于不常用的指令,通过组合指令来完成。所以在实现特殊任务时,RISC会比CISC更复杂,但是因为RISC指令简单,可以更轻松的实现更多核数更多流水线来弥补。而且RISC单元电路少,功耗低,整体能耗水平会比CISC好很多。

数据库业务属于简单业务,如果一台主机只运行数据库,那么在x86下其实有很多指令集是完全用不上的,所以理论上单位面积更低功耗,更多流水线,更高频率的Power平台运行数据库会更加高效。

同时IBM也提供了Linux on Power,并且同时提供了大端、小端两种模式,而不再要求必须是AIX,毕竟Linux大部分人会更熟悉。

MariaDB对Power的适配

MariaDB迁移到Power8平台不仅仅是简单的修改代码让编译可以通过,当然这也是很重要的。

从 git log 中可以看到,官方针对Power和Intel平台的不同,例如CACHE_LINE_SIZE的差异,Intel平台是64,Power平台是128。还有MEMORY_BARRIER上的差异,也会导致在锁操作和部分IO操作上两个平台会有差异,MariaDB在这部分也做了修改。

另外为了能使用IBM Advance Toolchain工具集编译 MariaDB 提升效率,也对代码上做了不少改动以便IBM Advance Toolchain能使用。

总之看起来一切都很好,针对很多细节都做了针对性修改。

编译中的问题

既然广告看起来这么好,那么就亲自动手试一下。

在Power on Linux上我下载了MariaDB 10.1.9的源码用GCC编译然而报错了:

[ 52%] Building CXX object storage/innobase/CMakeFiles/innobase.dir/api/api0api.cc.o
In file included from /root/mariadb-10.1.9/storage/innobase/include/ut0ut.h:36,
 from /root/mariadb-10.1.9/storage/innobase/include/univ.i:636,
 from /root/mariadb-10.1.9/storage/innobase/api/api0api.cc:27:
/root/mariadb-10.1.9/storage/innobase/include/os0sync.h:521:4: error: #error "Unsupported platform"
[ 52%] Building CXX object storage/archive/CMakeFiles/archive.dir/ha_archive.cc.o
In file included from /root/mariadb-10.1.9/storage/innobase/include/ sync0sync.h:837,
 from /root/mariadb-10.1.9/storage/innobase/include/mem0mem.h:34,
 from /root/mariadb-10.1.9/storage/innobase/include/data0data.h:33,
 from /root/mariadb-10.1.9/storage/innobase/include/que0que.h:30,
 from /root/mariadb-10.1.9/storage/innobase/include/api0misc.h:32,
 from /root/mariadb-10.1.9/storage/innobase/api/api0api.cc:38:
/root/mariadb-10.1.9/storage/innobase/include/sync0sync.ic: In function ‘lock_word_t ib_mutex_test_and_set(ib_mutex_t*)’:
/root/mariadb-10.1.9/storage/innobase/include/sync0sync.ic:85: error: ‘os_atomic_test_and_set’ was not declared in this scope
/root/mariadb-10.1.9/storage/innobase/include/sync0sync.ic: In function ‘void mutex_reset_lock_word(ib_mutex_t*)’:
/root/mariadb-10.1.9/storage/innobase/include/sync0sync.ic:113: error: ‘os_atomic_clear’ was not declared in this scope
make[2]: *** [storage/innobase/CMakeFiles/innobase.dir/api/api0api.cc.o] Error 1
make[1]: *** [storage/innobase/CMakeFiles/innobase.dir/all] Error 2
make[1]: *** Waiting for unfinished jobs....

查看了下报错的代码行:
storage/innobase/include/sync0sync.ic

ib_mutex_test_and_set(
/*==================*/
        ib_mutex_t*     mutex)  /*!< in: mutex */
{
#if defined(HAVE_ATOMIC_BUILTINS)
        return(os_atomic_test_and_set(&mutex->lock_word));
#else

storage/innobase/include/os0sync.h

469 # if defined(HAVE_IB_GCC_ATOMIC_TEST_AND_SET)
470
471 /** Do an atomic test-and-set.
472 @param[in,out]  ptr   Memory location to set to non-zero
473 @return the previous value */
474 inline
475 lock_word_t
476 os_atomic_test_and_set(volatile lock_word_t* ptr)
477 {
478        return(__atomic_test_and_set(ptr, __ATOMIC_ACQUIRE));
479 }
480
481 /** Do an atomic clear.
482 @param[in,out]  ptr   Memory location to set to zero */
483 inline
484 void
485 os_atomic_clear(volatile lock_word_t* ptr)
486 {
487   __atomic_clear(ptr, __ATOMIC_RELEASE);
488 }
489
490 # elif defined(IB_STRONG_MEMORY_MODEL)
491
492 /** Do an atomic test and set.
493 @param[in,out]  ptr   Memory location to set to non-zero
494 @return the previous value */
495 inline
496 lock_word_t
497 os_atomic_test_and_set(volatile lock_word_t* ptr)
498 {
499   return(__sync_lock_test_and_set(ptr, 1));

可以看到,只有在HAVE_IB_GCC_ATOMIC_TEST_AND_SETIB_STRONG_MEMORY_MODEL至少有一个标签打开的情况,ib_mutex_test_and_set()中调用的os_atomic_test_and_set()函数才会被开启。

然而因为RHEL6的原因,在Power8平台上GCC只有HAVE_ATOMIC_BUILTINS__powerpc__两个宏(升级到RHEL7可以解决)。因此就出现了这一幕,ib_mutex_test_and_set中调用了os_atomic_test_and_set()os_atomic_test_and_set()在头文件中没有被定义。修改很简单啦,改成用同一个宏判断就行了。

跟官方开发者沟通后这个fix可以解决这个问题

diff --git a/storage/innobase/include/os0sync.h b/storage/innobase/include/os0sync.h
index 8e4b4f4..e192a3a 100644
--- a/storage/innobase/include/os0sync.h
+++ b/storage/innobase/include/os0sync.h
@@ -487,7 +487,7 @@ os_atomic_clear(volatile lock_word_t* ptr)
 	__atomic_clear(ptr, __ATOMIC_RELEASE);
 }

-# elif defined(IB_STRONG_MEMORY_MODEL)
+# elif defined(HAVE_ATOMIC_BUILTINS)

 /** Do an atomic test and set.
 @param[in,out]	ptr		Memory location to set to non-zero

最后说两句

虽然官方也是有性能测试结果的,然而显然我们是不能相信官方测试的。因此我还会构造场景针对CPU本身的效能进行测试,下一期大家期待测试结果吧。

最后放两张官方的测试结果,看起来还是很牛X的!

MariaDB Total System
MariaDB Per Core