组织经常会要求 ArcGIS Enterprise 部署系统的正常运行时间达到一定水平,例如 99% 或更多的时间。对于这些组织,实施策略确保高可用性很重要。此策略应由基础架构元素和员工实践构成;缺少任何一项都无法确保高可用性。
高可用性的基础架构部分包括维护至少两个有效的部署副本以及实施故障转移机制,以在计算机故障后尽可能快地从主机自动切换至备用计算机。备用部署持续接收与主部署相同的内容和设置更新,而复制系统依赖定期备份来最大程度地减少数据丢失,并且不会自动进行故障转移,这是备份部署和复制系统的区别。实施高可用性时,应解决部署的所有关键任务和关键业务元素。
高可用性策略的人为部分包括确保故障转移始终成功且高效的组织实践。例如,高可用性系统中的主部署和备用部署不能应用计算机维护和系统更新,且系统管理员应随时负责处理可能发生的故障。
本部分中的主题解释了如何配置和维护高度可用的 ArcGIS Enterprise 部署。
何时应使用高可用性
高可用性 ArcGIS Enterprise 部署是一个复杂的系统,需要时间、精力和成本进行配置和维护。因此确定您的组织是否需要高可用性就十分重要。考虑使用高可用性的组织应思考以下问题:
- 您的组织是否具有强制性的服务级别协议?
- 服务级别协议要求的正常运行时间百分比为多少?
- 每年允许的停机时间是多少?
- 服务级别协议是如何强制执行的?
- 您的组织是否有高可用性的合同规定?
- 规定条款是什么?
- 关键任务或关键业务运营中是否涉及此 ArcGIS Enterprise 部署?
- 您的组织是否获得了 Esri 的相应许可来实施高可用性部署?
- 您的组织能否提供支持高可用性部署的必要硬件?
- 您是否拥有复制部署的每个组件的硬件资源?
- 您是否能够配置和维护用于执行故障转移的第三方负载均衡器?
配置高可用性 ArcGIS Server 站点
以下部分介绍了 ArcGIS Enterprise 的每个组件是如何在高可用性环境下部署的。
ArcGIS Enterprise 部署包含一个托管服务器。该服务器是一个专门运行门户托管服务(例如托管要素、切片和场景图层)的 ArcGIS GIS Server。
可以选择将门户与其他 ArcGIS GIS Server 站点联合,使它们能够共享身份验证并将 Web 服务作为项目自动注册到门户。您也可以将 ArcGIS GeoAnalytics Server、ArcGIS GeoEvent Server 或 ArcGIS Image Server 站点与您的门户联合。
所有这些站点以及您的托管服务器站点都可以配置为高可用性站点。实施高可用性服务器站点的方式取决于 Web 服务是位于一台计算机还是分布在多台计算机上。
如果您的站点中存在多台计算机,可配置负载均衡器,以便与 ArcGIS Server 计算机池进行通信。此计算机池共享服务器目录和配置存储。要防止因计算机故障造成的停机,请在高可用性文件服务器上配置这些目录。您还应该配置负载均衡器以定期执行每台服务器计算机的健康检查。
有关配置高可用性单机或多机服务器站点的信息,请参阅 ArcGIS Server 帮助中的以下主题:
联合高可用性 ArcGIS Server 站点和 ArcGIS Enterprise 门户时,请将管理 URL 设置为门户可以用于与站点中所有服务器通信的 URL。即使 URL 不可用(例如负载均衡器 URL),此操作也同样适用。
此外还应注意,使用负载均衡器 URL 将影响您连接到 ArcGIS Server Manager 的方式。例如,如果您使用负载均衡器 URL 进行联合,您必须使用负载均衡器连接到 Server Manager;而不能使用 https://gisserver.domain.com:6443/arcgis/manager 的默认 Server Manager URL。
高可用性中的重要概念
以下部分定义和讨论了高可用性系统中使用的关键术语。
负载均衡器
负载均衡器作为反向代理,可以将流量分配给后端服务器。高可用性 ArcGIS Enterprise 部署至少需要一个第三方负载均衡器以提高软件的性能和可靠性。它们可以处理门户和服务器站点的客户端流量,以及软件组件之间的流量。
虽然 ArcGIS Web Adaptor 被视为负载均衡器,但是它不足以在高可用性部署中作为独立的负载均衡器。您可以使用每个服务器站点为添加的安全匿名图层配置 ArcGIS Web Adaptor 实例,也可以设置 Web 层身份验证。在这些情况下,第三方负载均衡器会通过 Web Adaptor 发送流量,而不是直接发送到服务器计算机。
负载均衡器需要能够将 HTTP 健康检查发送到服务器健康检查或门户健康检查端点。负载均衡器可以创建和管理用于部署的 URL,在下一部分中将介绍相关内容。
联合中使用的 URL
高可用性 ArcGIS Enterprise 部署中使用多个不同的 URL。
服务 URL
此 URL 由外部用户和客户端应用程序使用,用于访问 ArcGIS Server 站点。此 URL 可用于处理 ArcGIS Server 流量的负载均衡器,可以将请求传递到服务器站点的 Web Adaptor 或直接传递到服务器计算机。
管理 URL
此 URL 由管理员和门户内部使用,可以在执行管理操作时访问 ArcGIS Server 站点。此 URL 必须指向负载均衡器;如果管理 URL 指向服务器站点中的单台计算机,且该计算机处于离线状态,那么联合将失效。根据系统架构,此 URL 可能与服务 URL 相同,也可能是另一个负载均衡器。
私有门户 URL
此 URL 是服务器站点用于与门户通信的内部 URL。此 URL 必须指向负载均衡器,且应该先于联合定义。如果您在设置 privatePortalURL 之前联合服务器站点,请按照配置一个现有部署,使其具有高可用性中的步骤 8 和 9 来更新部署内的 URL。与管理 URL 类似,此 URL 可能与门户的公共 URL 相同,也可能是另一个负载均衡器。
监控
每个 ArcGIS Enterprise 组件都可以处理部署内的计算机级别故障。在高可用性组件中,当一台计算机离线时,另一台计算机会继续运行,几乎不会受到影响。但是,部署现在存在一个故障点,并处于危险状态。因此,有必要对部署和各台计算机进行监控,以便快速检测故障,并在一台或多台计算机离线时及时通知管理员。这可以使用 ArcGIS Monitor 或第三方监控软件实现。
人员和实践
为了创建和维护高可用性部署,您的组织需要确保人员和实践也具有高度的可用性。如果您只有一名管理员,且该管理员在发生断电时未及时到岗,那么这就不是一个高可用性环境。
同样重要的还有组织的实践。如果您使用虚拟机,则不应将单个软件层的所有组件都放到一个主机中。例如,运行高可用性门户的两个虚拟机不应位于相同的虚拟机主机中,因为该主机为单一故障点。
组织必须确保每个软件层至少始终有一个组件运行,从而维持高可用性。如果您需要停止或重启组件,请确保运行相同组件的另一台计算机可以访问且正常工作。
您不应该计划同时备份或维护高可用性组件中的所有计算机。如果因修补或备份造成所有计算机故障,您将没有剩余计算机来承担工作。有关更多指导,请参阅将修补程序和更新应用于高可用性组件。
配置文件和数据存储
本地部署 ArcGIS Enterprise 的客户面临的挑战之一是高可用性存储设备的获取和维护。由于 ArcGIS Server 和 Portal for ArcGIS 都需要共享存储来设置高可用性,因此共享存储可能是单一故障点。在本地部署中,使用 NAS 设备或 RAID 来确保 ArcGIS Server 和 Portal for ArcGIS 的数据和配置文件的存储高度可用。
云部署提供了将数据和配置文件存储在已经具有高可用性的位置的选项:Amazon Web Services (AWS) 中的 Amazon Simple Storage Service (S3) 存储段或 Microsoft Azure 中的 BLOB 容器。这些存储位置和可用性由云提供商管理。有关详细信息,请访问各个云提供商的文档。
将组件定位于同一点
将高度可用 ArcGIS Enterprise 部署的所有组件和存储位置放置在同一数据中心或云区域中,以提供每个组件之间的低延迟连通性。请勿将高可用部署中的主计算机和备用计算机拆分到单独数据中心中。
为了防止单个数据中心或云区域丢失数据,可以在单独的数据中心中创建次要部署。有关详细信息,请参阅灾难恢复和复制。
高可用性的部署流程
ArcGIS Enterprise 的每个组件都使用不同方式部署。以下部分解释了每个组件的高可用性,并链接至有关 ArcGIS Enterprise 部署中 ArcGIS 组件的高可用性的配置说明。
配置高可用性 ArcGIS Server 站点
ArcGIS Enterprise 部署包含一个托管服务器。该服务器是一个专门运行门户托管服务(例如托管要素、切片和场景图层)的 ArcGIS GIS Server 站点。
可以选择将门户与其他 ArcGIS GIS Server 站点联合,使它们能够共享身份验证并将 Web 服务作为项目自动注册到门户。或者,也可以将门户与 ArcGIS GeoEvent Server、ArcGIS GeoAnalytics Server 或 ArcGIS Image Server 站点联合。
每个服务器站点都可以配置为高可用性站点。实施高可用性 ArcGIS Server 站点的方式取决于 Web 服务是位于一台计算机还是分布在多台计算机上。
如果您的站点中存在多台计算机,可配置负载均衡器,以便与 ArcGIS Server 计算机池进行通信。此计算机池共享服务器目录和配置存储。您应该在高可用性文件服务器上配置这些目录以确保正常运行时间。您还应该配置负载均衡器以定期执行每个服务器计算机的健康检查。
当您将高可用性 ArcGIS Server 站点与 Portal for ArcGIS 联合时,请将 管理 URL 设置为门户可用来与站点中所有服务器通信的 URL,即使某一服务器不可用(例如负载均衡器 URL)时也是如此。
使用负载均衡器 URL 将影响您连接到 ArcGIS Server Manager 的方式。例如,如果您使用负载均衡器 URL 进行联合,您必须通过负载均衡器连接到 Server Manager;而不能使用 https://gisserver.domain.com:6443/arcgis/manager 的默认 Server Manager Manager URL。
有关配置高可用性单机或多机 ArcGIS Server 站点的信息,请参阅 ArcGIS Server 帮助中的以下主题:
配置高可用性数据存储
ArcGIS Enterprise 门户中的托管 web 图层访问不同 ArcGIS Data Store 类型数据。可将各类型配置为高可用性站点。
有关配置高可用性 ArcGIS Data Store 的详细信息和说明,请参阅向您的数据存储添加计算机。
托管要素图层数据
要拥有高可用性托管要素图层数据,请安装 ArcGIS Data Store 并配置关系数据存储的主存储和备用存储。添加了备用数据存储后,发生下列情况时将激活备用数据存储:
- 主数据存储停止工作。ArcGIS Data Store 尝试在主机上重新启动数据存储。如果它不能重新启动,数据存储将故障转移到备用计算机。
- 主机的 Web 应用程序停止运行并尝试在主机上重新启动该 Web 应用程序。在极少情况下,此操作不可行,数据存储将故障转移到备用计算机。
- 主机不可用。如果计算机故障、电源线断开或失去网络连接,则可能发生这种情况。ArcGIS Data Store 将尝试连接到主计算机五次。如果在尝试五次后还不能连接,数据存储将故障转移到备用计算机。
在两台单独的计算机上安装 ArcGIS Data Store ,并在每台计算机上创建关系数据存储。使用作为门户托管服务器的 ArcGIS GIS Server 站点来配置每个关系数据存储。您配置的第一个关系数据存储是主关系数据存储计算机;您配置的第二台计算机是备用数据存储。
ArcGIS Data Store 会将托管要素图层数据从主数据存储自动复制到备用数据存储;因此,两个位置上都存在数据。ArcGIS GIS Server 站点将始终与主动(主)数据存储进行通信。
场景图层缓存
要拥有高可用性场景图层缓存,请在三台或更多台计算机上安装 ArcGIS Data Store,并在每台计算机上创建切片缓存数据存储。请始终创建奇数个切片缓存数据存储计算机。使用门户的托管服务器配置每个切片缓存数据存储计算机。
您必须在门户成员开始发布托管场景图层之前配置切片缓存数据存储中的所有计算机。当门户成员发布后,托管场景图层数据将在两台切片缓存数据存储计算机上进行复制。
观察和位置跟踪数据以及 GeoAnalytics 输出
要获得与 ArcGIS GeoEvent Server、ArcGIS Tracker 或 ArcGIS Mission 配合使用的高可用性存档观察数据,或使大数据要素分析生成的数据具有高可用性,需要在三台或更多台计算机上安装 ArcGIS Data Store 并在每台计算机上创建时空大数据存储。使用门户的托管服务器配置每个数据存储。在任何时候,每个数据集的副本都至少存在于两台数据存储计算机上。即使一台计算机出现故障,数据存储可确保其余至少两台计算机包含该数据。
配置高可用性源数据
您可以从多个源将数据发布至 ArcGIS Server 站点。如果在 ArcGIS Enterprise 部署中将文件夹或数据库注册到 ArcGIS Server 站点,则存储此源数据的方式或位置需满足高可用性需求。对于文件夹中的文件源,请将其存储在具有高可用性的文件服务器上。对于数据库,请使用数据库管理系统中的技术确保其具有高可用性。
配置高可用性门户
一个高可用性门户包括两台需要通过负载均衡器访问的门户计算机。
两台门户计算机将内容存储在公共目录下。为使门户具有高可用性,您必须在高可用性文件服务器上配置此内容目录。
高可用性门户配置完成后,主门户会将项目复制到备用门户。如果主机变为不可用,则备用计算机将升级为所有当前项目的主机。
如果停止 Portal for ArcGIS 服务或主机不可用(例如,硬盘驱动器发生故障),则门户会将故障转移到备用计算机。当计算机从故障中恢复或者您重启 Portal for ArcGIS 服务后,该计算机将作为备用机重新加入门户。
您应该为 WebContextURL 和 privatePortalURL 配置负载均衡器以检查门户计算机的健康状况。
有关详细信息和说明,请参阅配置高可用性门户。