广州和世鑫Synology群晖企业方案
在当今日新月异的计算机世界里,因部件故障、人为错误或系统故障造成的服务器故障可能会导致服务中断,并造成营运成本的提高。因此,不间断地运行是降低成本和管理时间的重要目标。
通过 Synology High Availability (SHA),您可部署 high-availability 解决方案来确保服务不间断。SHA 可让您将两台 Synology NAS 设备组成一个 high-availability 集群,确保存储服务不会中断,尽可能提高系统可用性,从而降低意外中断的风险和高昂的停机成本。
本教程将引导您完成通过 Synology NAS 创建 high-availability 解决方案的过程。
目录
- 什么是 Synology High Availability?
- 开始之前的准备
- 连接主机
- 使用两台主机创建 high-availability 集群
- 发生自动故障转移后解决错误
- 维护 high-availability 集群
1.什么是 Synology High Availability?
术语“high-availability”是指一种服务器布局解决方案,专为减少因服务器故障造成服务中断的情况而设计。Synology High Availability (SHA) 部署两台主机组成“high-availability 集群”,其中一台服务器担任“活动服务器”,另一台服务器担任备用“无源服务器”。
在 high-availability 集群中,活动服务器中的数据将持续复制到无源服务器,因此,两台主机上的所有文件完全相同。这样,在发生活动服务器损毁或故障的情况下,无源服务器可接管所有的服务,最大程度地降低系统服务中断的时间。
2.开始之前的准备
尝试创建 high-availability 集群前请仔细阅读以下部分。
硬件要求:
- SHA 需要两台相同的 Synology NAS 作为活动和无源服务器。
系统要求:
- 活动和无源服务器必须为相同型号,并都支持 Synology High Availability。
- 两台主机上必须安装同样版本的 DSM 及套件。
注:上图仅供参考。您的型号和 DSM 版本可能有所不同。
存储空间和硬盘:
- 两台主机的硬盘容量必须完全相同,以避免数据不一致。
- 活动和无源服务器都必须有同样数量的硬盘。此外,硬盘位置必须相同。
- 主机不能包含任何 SHR 格式的存储空间。进入存储空间管理员 > 存储空间以确保不存在 SHR 存储空间。
注:上图仅供参考。您环境中的硬盘数量和大小可能有所不同。
网络环境:
- 必须为两台主机分配静态 IP 地址以用于集群连接。请确保两台主机的 IP 地址均可访问并属于同一子网,否则在切换到无源服务器时可能会发生错误。若要更改网络设置,请登录各主机,并进入控制面板 > 网络 > 网络接口,选择网络接口,然后单击编辑。
- 两台主机必须有相同数量的 LAN 端口。如果两台主机都配备了额外的网络接口卡,则这些网卡也将被视为额外的 LAN 端口。
- Synology High Availability 不支持:DHCP、DHCP 服务器、IPv6、PPPoE 以及 Wi-Fi。创建 high-availability 集群之前,请确保上述功能已全部关闭。
注:一旦创建 high-availability 集群,SSH 和 NTP 服务器将在活动服务器上自动启用。
3.连接主机
本节将介绍如何连接两台主机以创建 high-availability 集群。请参阅以下步骤:
- 使用网线将两台主机连接起来。此连接将作为两台主机之间的 Heartbeat 连接,以加快通信并将数据从活动服务器复制到无源服务器。此连接必须满足以下条件:
- 在两台主机上使用相同的网络接口。例如,如果一端连接到一台主机上的 LAN 1 接口,则另一端也必须连接到另一台主机的 LAN 1 接口。
- 在两台主机上使用最快的网络接口。如果两台主机都配置了 10GbE 附加网络接口卡,则该连接也必须使用这些网卡。
- 两台主机必须直接连接,不得通过任何交换机或路由器。
- 使用网线通过剩余网络接口将两台主机连接网络。请确认这些连接有效且都属同一个网络。
注:为防止服务因网络故障而中断,建议您在网络环境中部署多个交换机,以便 high-availability 集群中的各主机能连接到不同交换机。
- 主机现已准备就绪,可组成一个 high-availability 集群。请按照下列步骤继续。
4.使用两台主机创建 high-availability 集群
正确连接两台主机后,可按以下步骤将其组成一个 high-availability 集群。
- 使用属于 administrators 群组的帐户登录您想指派为活动服务器的服务器。
- 打开 Synology High Availability。
- 单击创建 high-availability 集群,启动集群创建向导。
- 单击下一步。
- 选择要用于 high-availability 集群和 Heartbeat 连接的网络接口。然后单击下一步。
- 输入属于无源服务器上 administrator 群组的帐户凭据。然后单击下一步。
- 指定 high-availability 集群的名称和可访问集群资源的 IP 地址。向导会显示可用 IP 范围;请选择未被网络中其他服务使用的 IP 地址。然后单击下一步。
- 向导将检查系统是否满足所有要求。验证完成后,单击下一步。
- 如果在活动服务器上检测到存在数据、存储空间或 LUN,则可选择保留数据或擦除所有数据。单击下一步继续。
- 确认您之前进行的设置。然后单击应用。
- 阅读说明后勾选复选框,然后单击是。
- 向导将开始创建 high-availability 集群。创建时间根据系统环境而有所不同。
- 完成后,您将在集群页面中看到集群状态。
5.发生自动故障转移后解决错误
发生某些错误时,系统会自动将服务从活动服务器转移到无源服务器。这种情况称为“故障转移”。在下列情况下,系统可能会启动故障转移。
5.1 存储空间损毁
当活动服务器上的存储空间(如存储空间、iSCSI LUN)损毁,但无源服务器上相应的存储空间运行正常时,将会出现自动故障转移。例如,如果主机 A 为活动服务器,而主机 B 为无源服务器,则当主机 A 上的存储空间损毁但主机 B 上的相应存储空间仍正常时,系统将执行自动故障转移。
注:如果已损毁的存储空间上没有存储空间或 iSCSI LUN(块级),则系统不会启动自动故障转移。
自动故障转移过程完成后,请执行以下操作:
- 进入存储空间页面,找出主机 A(现为无源服务器)上丢失或损毁的硬盘。
- 如有硬盘丢失,请在相应插槽上安装硬盘,两台主机便拥有相同数量的硬盘。
- 如有硬盘损毁,请进行更换。
- 确认两台主机都含有相同硬盘配置,所有硬盘的状态均为正常或未初始化。
- 进入存储空间页面,单击修复以修复存储空间。
5.2 服务出错
当监控的服务发生错误时,会启动自动故障转移。例如,如果主机 A(活动服务器)上监控的服务发生故障,系统将向主机 B 实施自动故障转移。在此情况下,请在自动故障转移完成后执行以下操作。
- 进入主机页面。
- 主机 A 现在应为无源服务器,因此,请单击电源按钮 > 关闭。
- 待主机 A 完全关机后,再次将其开机。
5.3 电源故障
当活动服务器关机、重启、两组电源设备均发生故障或外部电源断电时,将发生自动故障转移。例如,如果主机 A 为活动服务器且其电源发生故障,系统将向主机 B 实施故障转移。电源恢复后,请将主机 A(现为无源服务器)开机。
6.维护 high-availability 集群
要了解例行维护程序,请参阅以下说明。
程序 |
说明 |
---|---|
将活动服务器切换为无源服务器 |
|
从集群中移除无源服务器 |
|
添加新的无源服务器 |
|
移除 high-availability 集群并将主机恢复到独立状态 |
|
更新系统/套件 |
|