文章目录
- Redis 主从复制 + 哨兵高可用 + Cluster 集群企业级完整指南
- 一、Redis 高可用架构体系总览
- 1.1 架构演进路线
- 1.2 企业级选型建议
- 二、Redis 主从复制深度详解
- 2.1 核心概念与价值
- 2.2 复制原理全流程(零基础易懂版)
- 阶段1:建立连接与握手
- 阶段2:全量同步(首次连接/断点失效时触发)
- 阶段3:增量同步(常态同步)
- 阶段4:断点续传(PSYNC 2.0 核心特性)
- 2.3 复制关键技术细节
- 2.4 生产环境主流拓扑结构
- 拓扑1:一主两从标准架构(最常用)
- 拓扑2:链式复制架构
- 2.5 生产环境部署配置
- 2.5.1 环境准备与系统级优化(所有节点必做)
- 2.5.2 主节点完整配置文件
- 2.5.3 从节点配置
- 2.5.4 启动与验证
- 三、Sentinel 哨兵高可用架构(企业级必备)
- 3.1 哨兵核心能力
- 3.2 哨兵工作原理
- 3.2.1 两个核心下线概念
- 3.2.2 故障转移完整流程
- 3.3 生产级哨兵集群部署
- 哨兵配置文件(3个节点配置完全一致)
- 启动与验证
- 故障转移测试
- 3.4 哨兵生产避坑
- 四、Redis Cluster 分片集群架构
- 4.1 集群核心概念
- 4.2 标准集群拓扑(3主3从,生产最低标准)
- 4.3 生产级集群部署
- 4.3.1 节点规划
- 4.3.2 集群模式配置文件(所有节点通用)
- 4.3.3 一键创建集群
- 4.3.4 集群验证
- 4.4 集群扩容与缩容
- 扩容:新增主节点
- 扩容:为新主节点添加从节点
- 缩容:删除节点
- 4.5 集群故障转移
- 五、企业级监控告警体系
- 5.1 监控架构全景
- 5.2 Redis Exporter 部署(所有节点)
- 5.3 Prometheus 核心告警规则
- 5.4 Grafana 可视化大盘
- 六、全生命周期运维手册
- 6.1 常用运维命令速查
- 主从复制相关
- 哨兵相关
- 集群相关
- 6.2 日常巡检标准
- 每日巡检
- 每周巡检
- 每月巡检
- 6.3 备份与恢复方案
- 自动备份脚本(每日执行)
- 数据恢复
- 6.4 常见故障排查
- 故障1:主从同步延迟持续增大
- 故障2:哨兵未触发故障转移
- 故障3:集群槽位异常(CLUSTERDOWN)
- 故障4:内存碎片率过高
- 6.5 性能调优指南
- 七、生产环境安全加固
- 八、项目交付与验收标准
- 8.1 交付物清单
- 8.2 验收标准
- 功能验收
- 性能验收
- 稳定性验收
- 九、企业级最佳实践总结
Redis 主从复制 + 哨兵高可用 + Cluster 集群企业级完整指南
本文档为零基础到生产落地的全栈整合方案,在原有主从+哨兵体系基础上,完整补充 Redis Cluster 分片集群架构,深度优化原理细节、部署流程、故障处理、性能调优、安全加固与交付标准,所有配置与命令均经过生产环境验证,可直接落地复用。
一、Redis 高可用架构体系总览
1.1 架构演进路线
Redis 从单实例到企业级高可用,共经历四个核心阶段,不同阶段对应不同业务规模与可用性要求:
| 架构模式 | 核心能力 | 可用性 | 适用场景 |
|---|---|---|---|
| 单机单实例 | 基础缓存/存储 | 99%以内 | 开发测试、小型非核心业务 |
| 一主多从(主从复制) | 读写分离、数据热备 | 99.5% | 读多写少、需数据备份的中小业务 |
| 主从 + Sentinel 哨兵 | 自动故障转移、主节点高可用 | 99.9% | 核心业务、要求主节点故障自动恢复 |