GeoAnalytics Server 旨在加速您的分析工作流,并帮助您快速处理大型数据集。GeoAnalytics Server 中的这种加速由其基础分布式计算框架来实现。该框架的独特之处在于其可以使用单台计算机上的资源,也可以在多机站点中的三台计算机上分配计算进程。
以下是调整、配置和修改您的 GeoAnalytics Server 站点的最佳做法。建议您遵循这些做法,通过对站点进行适当调整,以利用 GeoAnalytics Server 所提供的性能优势。
规划您的 GeoAnalytics Server 站点
GeoAnalytics Server 是一种 ArcGIS Enterprise 功能,可通过将 ArcGIS Server 许可为 GeoAnalytics Server 来将其启用。要设置 GeoAnalytics Server,您必须先设置 ArcGIS Enterprise 基础部署并联合您的 GeoAnalytics Server 站点。此外,您必须安装并注册配置为时空大数据存储的 ArcGIS Data Store,此时空大数据存储可用于存储您的 GeoAnalytics Server分析结果和分析的输入。
了解有关设置 ArcGIS GeoAnalytics Server 的详细信息
建议您将 GeoAnalytics Server 安装在单独的计算机上,而非其余 ArcGIS Enterprise 部署所使用的计算机。此工作负载分离可确保分布式计算框架不会与用于其他操作的计算机上的其他资源竞争。
出于类似的原因,您还应该在 ArcGIS Enterprise 基础部署中的单独计算机以及一台或多台 GeoAnalytics Server 计算机上安装 ArcGIS Data Store(配置为时空大数据存储)。
注:
GeoAnalytics Server 可以部署在云基础架构上,并且系统还提供一些工具来帮助您在 ArcGIS Enterprise on Microsoft Azure 和ArcGIS Enterprise on Amazon Web Services 中进行部署。本主题中的信息同样适用于云部署。
计算机的数量
针对 GeoAnalytics Server站点选择 GeoAnalytics Server 计算机的数量时,支持以下配置:
- 针对单机站点,GeoAnalytics Server 位于一台计算机上
- 针对多机站点,GeoAnalytics Server 位于三台计算机上
不支持具有偶数台计算机或超过三台计算机的站点。
您需要具有与 ArcGIS Data Store 计算机相同数量的 GeoAnalytics Server 计算机(配置为时空大数据存储)。例如,如果您使用的是三机 GeoAnalytics Server站点,则还必须至少提供三台运行时空大数据存储的计算机。
注:
除了 ArcGIS Data Store 和 GeoAnalytics Server 安装之外,您还必须配置 ArcGIS Enterprise 基础部署。
您可以利用 GeoAnalytics Server(使用一台计算机)的分布式计算功能。单机可以具有非常强大的功能,因为一台计算机将针对 GeoAnalytics Server分析使用其大部分资源(CPU 和 RAM)。如果您不想扩展到多台计算机,也可以选用更大型的计算机来提升分析能力(请参阅下文中的计算机的大小)。
最好首先部署一台计算机来观察其是否满足您的分析需求。如果一台计算机不能满足您的分析需求(您的分析作业无法完成或者无法在适当的时间内完成),则可以执行以下任一操作:
- 向现有计算机添加资源(CPU 和 RAM)。
- 配置另一台具有更多资源的计算机。
- 将站点扩展为使用多台计算机(三台计算机)。
如果您决定扩展到多台计算机,则下一步是扩展到三机站点。不支持双机 GeoAnalytics Server 站点或超过三台计算机的站点。有关增加站点中计算机数量的详细信息,请参阅下文中的将计算机添加到 GeoAnalytics 站点。
注:
站点中 GeoAnalytics Server 计算机的数量应始终为奇数(一台或三台)。GeoAnalytics Server中不支持其他计算机数量。计算机的大小
GeoAnalytics Server 计算机的最低容量要求为 4 核和 16 GB RAM。但是,建议设置为每台计算机至少 4 个内核和 32 GB RAM。如果增加计算机使用的 RAM 数量,则可能会体验到性能改进。
注:
由于数据大小和所运行分析工具不同,您可能会体验到各工作流之间性能(完成作业所需的时间)的差异。
如果您使用的是三机站点,则所有运行 GeoAnalytics Server 的计算机都应该具有相同数量的 RAM。配置 GeoAnalytics Server 站点时,您需要设置每台计算机将使用的可用 RAM 百分比。所有计算机的可用 RAM 均为上述数量时,作业才会启动。因此,如果某一台计算机比其他计算机的 RAM 更多,但 RAM 使用量只能达到所有计算机中的较少者,因此具有更多 RAM 的计算机并不能发挥其优势。
时空大数据存储计算机的数量
安装并配置了时空大数据存储的计算机数量应等于或大于运行 GeoAnalytics Server 的计算机数量。例如,如果您的 GeoAnalytics Server 使用三台计算机,则应该至少有三台计算机会将时空大数据存储注册到您的 ArcGIS Enterprise 托管服务器。
如果 GeoAnalytics Server 计算机的数量大于配置了时空大数据存储的计算机数量,则分析期间将显示以下消息:由于潜在并行编写器的数量远大于数据存储器中的节点数量,因此可能会出现写入失败。 如果显示上述消息,则需要增加用于时空大数据存储的计算机数量,以使该数量等于或大于用于 GeoAnalytics Server 站点的计算机数量。
配置和使用 GeoAnalytics Server 站点
首次设置 GeoAnalytics Server 站点时,请考虑以上有关站点规划和计算机调整的信息。如果您的分析需要更改并且需要增加(或减少)GeoAnalytics Server站点中的计算机数量,请按照下文中将计算机添加到 GeoAnalytics 站点和从 GeoAnalytics 站点中删除计算机部分中的步骤进行操作。
使用的内核数量和 RAM 数量
完成设置 GeoAnalytics Server 的步骤后,您需要配置系统属性以优化站点使用的资源(CPU 和 RAM)数量。运行分析之前,请按照 GeoAnalytics Server 设置中的步骤进行操作。
单用户设置
GeoAnalytics Server不适用于同时运行大型分析、将会竞争资源的多个用户。当单个用户一次运行一个分析时,GeoAnalytics Server可以达到最佳运行状况。这样,您的分析可以利用所有可用资源,最大程度地减少处理时间。
为确保 GeoAnalytics Server达到最佳速度和性能,请确保每次只有一位用户使用该系统(运行分析)。该用户完成其分析后,可以运行另一个单独的分析,或者由另一位分析师使用该系统来运行其作业。
如果多位用户同时运行分析,则将发生以下情况:
- 如果您有一台 GeoAnalytics Server 计算机,则每个作业都会等待之前的 GeoAnalytics Server作业完成后才能运行。
- 如果您有三台 GeoAnalytics Server 计算机,则作业等待资源的时间将持续 10 分钟。如果资源不可用(即,上一个作业未完成),则作业将取消且您将收到一则通知。
监控您的站点和作业
作为管理员,您可以通过几种方法来监控站点的状态和健康状况。
要监控分布式框架,请使用 GeoAnalytics 健康检查。或者,您也可以使用 ArcGIS Monitor,该应用程序可用于监控 ArcGIS Enterprise 部署和 GeoAnalytics Server健康检查。
您也可以使用 Server Manager 中的作业资源来查询当前正在运行和已完成的 GeoAnalytics Server 作业等,或受到停止作业干预的作业。如果您要查看您的站点当前是否正在运行分析以及作业已运行的时长,则此功能非常有用。
修改 GeoAnalytics Server 站点
您可能需要调整 GeoAnalytics Server 站点的大小。通常,这是为了减少处理时间,尤其是正在分析的数据量有所增加的情况下。
GeoAnalytics Server 依靠服务来管理和处理 GeoAnalytics Server工具。
重启计算机
作为已重新启动的 GeoAnalytics Server 站点之一部分的计算机,将在 ArcGIS Server 进程开始后准备就绪,随时可用。计算机重新启动后,请等待五分钟以确认其已恢复运行。如果您已等待五分钟,而在重新启动后仍然存在问题,请参阅常见 GeoAnalytics 问题和解决方案来了解后续步骤。
将计算机添加到 GeoAnalytics Server站点
如果您正在使用单机站点并且希望增加 GeoAnalytics Server 计算机的数量,则可以通过添加两台 GeoAnalytics Server 计算机,最终形成三机 GeoAnalytics Server站点的方法对站点进行扩展。要添加计算机,请按照以下步骤进行操作:
- 在两台计算机上安装 ArcGIS Server 并授予其 GeoAnalytics Server许可。
- 确保 GeoAnalytics Server作业未在当前 ArcGIS Server 站点上运行。
- 使用已安装的两台计算机上的安装向导将其添加到现有 GeoAnalytics Server 站点。
从 GeoAnalytics Server站点中删除计算机
请按照以下步骤从 GeoAnalytics Server站点中移除计算机:
- 确保 GeoAnalytics Server作业未在当前 ArcGIS Server 站点上运行。如果作业正在运行,请将其取消或等待其完成。
- 使用 ArcGIS Server Manager 从您的 GeoAnalytics Server站点中移除两台计算机。
通过多机 GeoAnalytics Server 站点管理停机
本部分仅当使用由三台计算机组成的多机 GeoAnalytics Server 站点,并且需要在一台或两台计算机停机期间运行分析时适用。当停机为计划事件(用于维护、更新、修补或其他)或者计划外事件时适用。
如果在此状态(一台或两台计算机停机)下运行作业,则在按照故障排除指南中的相应步骤进行操作之前,您将收到一条错误消息:“无法初始化分布式计算平台”。建议不要长期或永久地在此状态下运行。
如果您希望通过移除计算机来缩小站点的规模,请遵照上述步骤进行操作。
注:
如果您正在执行计划维护,则在通过取消作业或等待作业完成来停止计算机之前,请确保未运行 GeoAnalytics Server 分析。