4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)

高可用性

我们的现代社会严重依赖计算机通过网络提供的信息。移动设备加剧了这种依赖性,因为人们可以随时随地访问网络。如果您提供此类服务,那么大多数时候都可以使用它们就非常重要。

我们可以在数学上将可用性定义为(A)在给定间隔内可以使用服务的总时间与(B)间隔长度的比值。通常以给定年份的正常运行时间百分比表示。

可用性-每年的停机时间


可用性 %

每年停机时间

99

3.65天

99.9

8.76小时

99.99

52.56分钟

99.999

5.26分钟

99.9999

31.5秒

99.99999

3.15秒

有几种提高可用性的方法。最优雅的解决方案是重写软件,以便可以同时在多个主机上运行它。软件本身需要一种检测错误并进行故障转移的方法。如果您只想提供只读网页,这相对容易。但是总的来说,这很复杂,有时是不可能的,因为您无法自己修改软件。以下解决方案无需修改软件即可工作:

使用可靠的“服务器”组件

具有相同功能的计算机组件可以具有不同的可靠性编号,具体取决于组件的质量。大多数供应商将具有更高可靠性的组件作为“服务器”组件出售-通常以更高的价格出售。

消除单点故障(冗余组件)

使用不间断电源(UPS)

在主板上使用冗余电源

使用ECC-RAM

使用冗余网络硬件

使用RAID进行本地存储

对VM数据使用分布式冗余存储

减少停机时间

快速访问的管理员(24/7)

备件的可用性(Proxmox VE集群中的其他节点)

自动错误检测(由ha-manager提供)

自动故障转移(由ha-manager提供)

 

像Proxmox VE这样的虚拟化环境可以轻松实现高可用性,因为它们消除了“硬件”依赖性。它们还支持设置和使用冗余存储和网络设备。因此,如果一台主机发生故障,您只需在集群中的另一台主机上启动这些服务即可。

更好的是,Proxmox VE提供了称为ha-manager的软件堆栈,可以自动为您完成此操作。它能够自动检测错误并执行自动故障转移。

Proxmox VE ha管理器的工作方式类似于“自动化”管理员。首先,配置它应管理的资源(VM,容器等)。然后,ha-manager会观察到正确的功能,并在出现错误的情况下将服务故障转移到另一个节点。ha-manager还可以处理正常的用户请求,这些请求可能会启动,停止,重定位和迁移服务。

但是高可用性是有代价的。高质量的组件更昂贵,并且使它们冗余至少会重复成本。额外的备件进一步增加了成本。因此,您应该仔细计算收益,并与这些额外成本进行比较。        

将可用性从99%增加到99.9%相对简单。但是,将可用性从99.9999%提高到99.99999%非常困难且昂贵。ha-manager具有典型的错误检测和故障转移时间,大约为2分钟,因此您可获得的可用性不超过99.999%。

 

要求

开始使用HA之前,必须满足以下要求:

至少三个群集节点(以获得可靠的仲裁)

VM和容器的共享存储

硬件冗余(无处不在)

使用可靠的“服务器”组件

硬件看门狗-如果不可用,我们将退回到linux内核软件看门狗(softdog)

可选的硬件围栏设备

资源

我们将ha-manager处理的主要管理单元称为资源。资源(也称为“服务”)由服务ID(SID)唯一标识,该服务ID由资源类型和特定于类型的ID组成,例如:vm:100。该示例将是ID为100的vm(虚拟机)类型的资源。

目前,我们有两种重要的资源类型-虚拟机和容器。这里的一个基本想法是,我们可以将相关软件捆绑到这样的VM或容器中,因此不需要像rgmanager那样由其他服务组成一项大型服务。通常,HA管理的资源不应依赖于其他资源。

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图1)

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图2)

4种请示状态

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图3)

请求的资源状态。CRM 读取此状态并相应地执行操作。请注意,已启用只是启动的别名。

开始started

CRM 尝试启动资源。服务状态设置为在成功启动后启动。在节点失败时,或在启动失败时,它会尝试恢复资源。如果一切失败,服务状态设置为错误。

停止stopped

CRM 尝试将资源保持停止状态,但仍尝试在节点发生故障时重新定位资源。

禁用ignored

CRM 尝试将资源置于停止状态,但不会尝试在节点失败时重新定位资源。此状态的主要目的是错误恢复,因为它是将资源从错误状态中移出的唯一方法。

忽视disabled

资源将从管理器状态中删除,因此 CRM 和 LRM 不再接触资源。影响此资源的所有 Proxmox VE API 调用都将执行,直接绕过 HA 堆栈。当源处于此状态时,CRM 命令将被扔掉。在节点发生故障时,资源不会重新定位。

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图4)

添加资源成功

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图5)

测试高可用性

把节点A1的网线全部拔掉

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图6)

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图7)


虚拟机切换到A2节点后并重启系统

4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图8)4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)(图9)



1、本站资源长期持续更新。
2、本资源基本为原创,部分来源其他付费资源平台或互联网收集,如有侵权请联系及时处理。
3、本站大部分文章的截图来源实验测试环境,请不要在生产环境中随意模仿,以免带来灾难性后果。

转载请保留出处:  www.zh-cjh.com珠海陈坚浩博客 » 4.2 ProxmoxVE6.3:配置并测试虚拟机的高可用性(共享存储)

作者: cjh


手机扫一扫,手机上查看此文章:

一切源于价值!

其他 模板文件不存在: ./template/plugins/comment/pc/index.htm

未雨绸缪、居安思危!

数据安全、有备无患!

注意操作、数据无价!

一切源于价值!