对于高可用(High Availability, HA)服务部署,推荐使用 Rocky Linux 9(或 RHEL 9)的最小化安装(Minimal Install),而非较旧版本(如 RHEL/Rocky 8 或更早)。以下是关键理由和最佳实践建议:
✅ 首选:Rocky Linux 9(或 RHEL 9)最小化安装
(当前稳定、长期支持、HA生态最成熟)
| 维度 | 说明 |
|---|---|
| 内核与集群栈支持 | RHEL 9/Rocky 9 基于 Linux kernel 5.14+,原生集成 Pacemaker 2.1.7+、Corosync 3.1+、Resource Agents 4.10+,全面支持 QDevice、QNetd、SBD(with modern sbd daemon)、fencing(如 fence_virt, fence_aws, fence_gcp 等),且默认启用 cgroup v2 和 systemd-resolved,提升容器化HA服务(如 Pacemaker + Podman/Kubernetes)稳定性。 |
| 生命周期与支持 | Rocky Linux 9:主流支持至 2027年6月(EOL 2032),RHEL 9:标准支持至 2027年(Extended Update Support 可延至 2032)。足够覆盖企业级HA系统5–7年生命周期。 |
| 最小化安装优势 | “Minimal Install”(通过 Anaconda 选择 Minimal Install 或使用 @^minimal-environment 包组)仅安装约 300–400 个核心包(不含 GUI、打印、蓝牙等无关组件),显著减少攻击面、降低补丁复杂度、提升启动/故障恢复速度,符合 CIS、STIG 等安全基线要求。 |
| HA认证与兼容性 | Red Hat 官方认证的 HA 集群(Red Hat High Availability Add-On)仅支持 RHEL 9+;Rocky Linux 9 完全二进制兼容该生态,可无缝使用相同配置工具(pcs, crmsh)、资源X_X(ocf:heartbeat:*, ocf:pacemaker:*)及文档(Rocky Docs HA Guide)。 |
⚠️ 不推荐的版本:
- RHEL/Rocky 8:虽仍受支持(EOL 2029),但 Pacemaker/Corosync 版本较旧(Pacemaker 2.0.x),缺乏对
qdevice net的完整 TLS 1.3 支持、SBD 多设备冗余改进有限,且部分云厂商 fencing agent(如 Azure VMSS、AWS IMDS v2)在 8.x 中需手动 backport。 - RHEL/Rocky 7:已进入维护阶段(RHEL 7 EOL 2024年6月),不建议新部署;Corosync 2.x 架构无原生 quorum over TLS、fencing 配置复杂,不符合现代安全合规要求。
🔧 最小化安装后必备增强步骤(HA就绪):
# 1. 启用高可用仓库(Rocky)
sudo dnf config-manager --enable ha
# 2. 安装核心HA组件(最小依赖)
sudo dnf install -y pacemaker pcs corosync fence-agents-all sbd
# 3. 禁用非必要服务(加固)
sudo systemctl disable --now firewalld NetworkManager tuned
sudo systemctl enable --now sshd chronyd
# 4. 配置时间同步(HA关键!)
echo "server pool.ntp.org iburst" | sudo tee -a /etc/chrony.conf
sudo systemctl restart chronyd
# 5. 创建专用HA用户(用于 pcs auth)
sudo useradd -r -s /sbin/nologin hacluster
echo "hacluster:your_secure_password" | sudo chpasswd
📌 补充建议:
- 硬件/虚拟化层:确保底层平台支持可靠的 fencing(如 IPMI/iDRAC/iLO、云厂商元数据服务、共享存储 SBD 设备),这是 HA 集群防脑裂(split-brain)的基石。
- 配置管理:使用 Ansible(配合
community.general.pacemaker_cluster)实现集群配置幂等部署。 - 监控与告警:集成
pcsdWeb UI(端口 2224)或 Prometheus +pacemaker_exporter实现指标采集。
✅ 总结:
Rocky Linux 9(最小化安装)是当前最适合生产环境高可用服务部署的选择——它在安全性、稳定性、现代特性支持、社区支持和未来兼容性上达到最佳平衡。避免为“熟悉旧版”而牺牲长期可维护性;RHEL 9/Rocky 9 的 HA 栈已非常成熟,且迁移路径清晰(官方提供 RHEL 8→9 升级指南)。
如需具体场景(如 PostgreSQL HA、NFS-Ganesha、Kubernetes with Pacemaker CNI)的配置模板,我可进一步提供。
云计算导航