news 2026/4/29 4:06:09

MySQL 优化从库延迟的一些思路

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MySQL 优化从库延迟的一些思路

作者:孙绪宗,新浪微博 DBA 团队工程师,主要负责 MySQL、PostgreSQL 等关系型数据库运维。

爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。

本文约 1000 字,预计阅读需要 3 分钟。

引言

在数据库运维过程中,无论是迁移扩容还是生产投量,都必不可少的会遇到从库迁移追不上的问题。这些问题令人头疼。

以下列举几个我个人遇到过的原因:

  • buffer_pool设置过大,导致 MySQL 使用 SWAP
  • 备份导致 SQL_THREAD 回放等待 MDL
  • 大事务
  • 慢查询导致从库性能低下
  • 并行复制导致从库延迟监控一直为 1s
  • 网络问题

具体情况具体分析,这里不赘述。

如果你在常规排查之后,依然无法解决。接下来,我将根据自身的一些经验,提供一些参数调整思路,供大家参考。

思路一:sync 相关

我们在追延迟的情况,可以调整一下参数,增加日志落盘效率。后续上线从库可以再设置回来。

sync_binlog=0 sync_master_info=10000 #default sync_relay_log=10000 #default sync_relay_log_info=10000 #default

思路二:buffer 和并发等相关

可以考虑增加一下buffer_pool,SQL_THREAD 回放执行的更快。

如果内存空间不足的话,可以适当调整change buffer的比例(前提是无读,正常情况下延迟库均为无业务连接)。

innodb_buffer_pool_size=24G #24*1024*1024*1024 innodb_change_buffer_max_size=50 innodb_thread_concurrency=0 innodb_adaptive_hash_index=0

增大innodb_buffer_pool_size风险点:

  1. 内存过度分配导致 SWAP 触发或 OOM,需预留足够内存给系统和 MySQL 其他组件,建议缓冲池不超过物理内存的 70%;
  2. 调整需分步进行,结合系统内存监控,避免一次性设置过大。

思路三:slave 相关

考虑开启并行复制

开启并行复制,8.0+ 版本考虑用 writeset。复制线程可以多观察一下,如果没够的话,可以考虑增加。但不建议超过 CPU 核心数或者innodb_thread_concurrency参数值。

slave_preserve_commit_order会加一层锁,追延迟的时候建议关闭,后续上线从库可以再打开。

slave_parallel_type=LOGICAL_CLOCK slave_parallel_workers=16 slave_preserve_commit_order=OFF

个人不建议修改以下参数,性能虽然会有所增长,但同时会导致主库commit等待。当然部分非实时类业务可以调整。

binlog 的组提交的两个有关参数:

  • binlog_group_commit_sync_delay参数,表示延迟多少微秒后才调用 fsync 刷盘;
  • binlog_group_commit_sync_no_delay_count参数,表示累积多少次以后才调用 fsync。

考虑关闭 log_slave_updates

log_slave_updates这个需要重启生效。但是有 gdb 经验的小伙伴可以 gdb 修改,不需要重启,只需要重启 slave 复制即可生效。无 gdb 经验可能会导致 crash 不建议。

同时注意需要了解架构,没有 binlog 备份或者级联库,且无业务连接,建议可以关闭。

思路四

MGR 架构可以考虑先改为异步复制,关闭slave_preserve_commit_order,待延迟追完后再加入到集群。

思路五

其他性能参数按照模板理论上不会有太大问题,这套操作下来延迟大概率会有所下降,降为 0 只是时间问题。

附录

并行复制积压日志解析:

2021-01-10T16:08:39.947611+08:00 85441 [Note] Multi-threaded slave statistics for channel '';seconds elapsed = 120;events assigned = 4005889;worker queues filled over overrun level = 0;waited due a Worker queue full = 0;waited due the total size = 0;waited at clock conflicts = 6918018179200 waited (count) when Workers occupied = 0 waited when Workers occupied = 0 -------------------------------- Multi-threaded slave statistics for channel ”: seconds elapsed = 120; 每隔120s输出 eventsassigned = 4005889; 总共有多少个event被分配执行 queues filled over overrun level = 0; 多线程同步中,worker 的私有队列长度超长的次数 waited due aWorker queue full = 0; 因为worker的队列超长而产生等待的次数 waited due the total size = 0; 超过最大size的次数 waited at clock conflicts= 6918018179200;因为逻辑时间产生冲突的等待时间,单位是纳秒 waited (count) when Workers occupied = 0 因为workder被占用而出现等待的次数。(总计值) waited when Workers occupied = 0 因为workder被占用而出现等待的总时间,总计值,单位是纳秒
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/29 4:05:48

如何验证翻译质量?CSANMT提供可读性评估参考

如何验证翻译质量?CSANMT提供可读性评估参考 📖 背景与挑战:AI智能中英翻译的“信达雅”难题 随着全球化进程加速,跨语言沟通需求激增。传统机器翻译(如早期统计模型)虽能实现基本语义转换,但译…

作者头像 李华
网站建设 2026/4/28 21:48:04

基于单片机的身高测量仪

基于单片机的身高测量仪设计 第一章 系统整体架构设计 基于单片机的身高测量仪以“精准测量、操作简易、便携实用”为核心目标,采用“检测-处理-显示-交互”的四层架构。系统核心包含四大功能模块:距离检测模块、单片机控制模块、显示模块及交互模块。距…

作者头像 李华
网站建设 2026/4/28 13:37:52

基于单片机的智能恒温睡袋

基于单片机的智能恒温睡袋设计 一、系统设计背景与总体目标 传统睡袋多依赖填充物保温,存在温度不可控、适配性差的问题——冬季易因保暖不足着凉,夏季或室内供暖环境下又易闷热,尤其对婴儿、老人及户外露营者等群体,难以满足个性…

作者头像 李华
网站建设 2026/4/25 19:04:37

为什么你的翻译模型总报错?CSANMT锁定兼容版本一键解决

为什么你的翻译模型总报错?CSANMT锁定兼容版本一键解决 🌐 AI 智能中英翻译服务 (WebUI API) 在多语言交流日益频繁的今天,高质量的自动翻译工具已成为开发者、内容创作者乃至企业用户的刚需。然而,许多用户在部署本地化翻译模…

作者头像 李华
网站建设 2026/4/28 23:13:45

M2FP模型在智能家居中的人体检测应用

M2FP模型在智能家居中的人体检测应用 随着智能家居系统对环境感知能力要求的不断提升,传统的人体存在检测(如红外、雷达)已难以满足精细化交互需求。如何实现非侵入式、高精度、可解释性强的人体空间理解,成为下一代智能家庭中枢的…

作者头像 李华
网站建设 2026/4/25 19:05:14

中小企业降本妙招:M2FP CPU版镜像免费部署,省去GPU成本

中小企业降本妙招:M2FP CPU版镜像免费部署,省去GPU成本 📖 项目简介:为何选择M2FP多人人体解析? 在数字内容创作、虚拟试衣、智能安防和人机交互等场景中,人体解析(Human Parsing)…

作者头像 李华