背景
主从切换是高可用MySQL架构的必要步骤(即使用不发生,也要有备无患)。一般设置为双M(M1、M2),假设当前状态为写M1,而M2只读,切换的大致流程如下:
1、 停止应用写M1,将M1设置为只读
2、 检查M2的slave status直到赶上M1
3、 将M1设置为可写
其中在第2步细化为
a) 在M1上show master status;得到binlog位置P,因为已经设为只读,不会变化
b) 循环检测M2上的执行位置,若未到P,则过几秒再查。循环直到从库追上。
这里介绍一个函数用于简化步骤b.
函数master_pos_wait
语法 select master_pos_wait(file, pos[, timeout]).
这里的file和pos对应主库show master status得到的值,代表执行位置。 函数逻辑是等待当前从库达到这个位置后返回, 返回期间执行的事务个数。
参数timeout可选,若缺省则无限等待,timeout<=0时与缺省的逻辑相同。若为正数,则等待这么多秒,超时函数返回-1.
其他返回值:若当前slave为启动或在等待期间被终止,返回NULL; 若指定的值已经在之前达到,返回0
master_pos_wait的实现逻辑
用户调用该函数后,根据传入参数调用pthread_cond_timedwait或pthread_cond_wait。 SQL_THREAD线程每次apply完一个事件后会触发更新relay info, 并通知上面等待的线程。因为可能有多个用户等待,因此用广播方式。
关于事件个数的计算比较复杂,有兴趣的同学可以看这篇, 不过在本文讨论的这个问题上,正数返回值并不重要。
小结
用master_pos_wait来实现上面的步骤b,则可以简化为:
b’) 在M上执行select master_pos_wait(file, pos),返回后判断一下返回值>=0 则认为主从同步完成。
好处是
1) 简化逻辑,不用在应用脚本判断
2) 在追上的第一时间就能感知,否则可能多等若干秒