以下为您在使用 ArcGIS GeoAnalytics Server 时可能遇到的问题以及建议的解决方案。
设置和配置 GeoAnalytics Server
- 如何设置 GeoAnalytics Server?
- 我可以为我的 GeoAnalytics Server 站点使用多少台计算机?
- 如何联合 GeoAnalytics Server?
- 我是否应将时空大数据存储注册到托管服务器、GeoAnalytics Server 或其他服务器?
- 我是否可以对 GeoAnalytics Server 和 ArcGIS GeoEvent Server 使用相同的时空大数据存储?
- 我想使用多台计算机创建 GeoAnalytics Server 站点。如何创建多机?
- 如何更改用于 GeoAnalytics Server 分析的资源数量(内核和内存)?
- 我该何时重置 Zookeeper?
数据源和大数据文件共享
- 可以使用哪些类型的数据作为输入?
- 我可以使用哪些数据格式和存储位置作为分析的输出?
- 在哪里注册大数据文件共享?
- 我没有看到在 ArcGIS Server Manager 中注册大数据文件共享的选项。
- 尝试生成大数据文件共享时,收到了错误消息“该位置无法访问”。这是怎么回事?
- 生成大数据文件共享后,我的清单中没有数据集。这是怎么回事?
- 生成大数据文件共享后,一些数据集未列出。如何确保他们正常显示?
- 生成大数据文件共享后,数据集中没有信息性字段名称。如何解决此问题?
- 我门户的其他成员无法访问我注册的大数据文件共享或使用其进行分析。
- 我注册了大数据文件共享,并且已经向数据源添加了更多记录。我需要修改清单吗?
- 如何检查时间和几何是否正确注册?
- 我的地理数据库中有数据。我能否在 GeoAnalytics Server中使用此数据?
运行 GeoAnalytics Server
GeoAnalytics 工具集 运行失败
- 我看到执行 {toolName} 失败。请联系管理员,上报作业 ID 为“{jobID}”的错误。应该怎么办?
- 运行 GeoAnalytics Server 作业时出现意外故障,显示错误消息 GeoAnalytics 作业正在等待资源,尚未开始。10 分钟后,该作业将自动取消。 为什么会发生这种情况?
- 正在运行 GeoAnalytics Server 作业时意外发生故障,系统中显示错误消息无法初始化分布式计算平台。我该怎么办?
- 我的 GeoAnalytics Server 作业运行失败,并显示错误消息 Spark 计算平台服务未启动。 我应该如何启动计算平台服务?
- 正在运行 GeoAnalytics Server 作业时意外发生故障,并显示错误消息已提交、正在执行和已失败。如何解决此问题?
- 正在运行 GeoAnalytics Server 作业时意外发生故障,系统中显示错误消息作业已取消。这是怎么回事?
- 在多机站点中的其中一台计算机上移除或关闭 ArcGIS Server 后,为什么我的 GeoAnalytics Server 在短时间内无法使用?
- 使用具有有效托管要素服务或大数据文件共享的 ArcGIS REST API 作为输入运行分析时,分析将会失败,同时显示错误消息参数 'inputLayer' 无效。这是怎么回事?
- 有时我的结果会返回以下消息:分析结果未返回任何要素。未创建任何图层。这是怎么回事?
设置和配置 GeoAnalytics Server
除了应用的许可外,为 GeoAnalytics Server 创建多机站点与为 ArcGIS Server 设置多机站点并无不同。请确保您的共享配置存储对所有服务器计算机均可用,并确保所有计算机具有相同的规格(内核数量和 RAM 数量)。如果您要将单机站点扩展为三机站点,请确保您当前的配置存储对所有计算机均可访问。
管理员可通过 GeoAnalytics Server Administrator Directory 系统属性设置来设置计算机资源(内核和内存)的百分比。您可以使用 Spark 健康检查来检查其数量。
数据源和大数据文件共享
您可以使用连接到的数据作为大数据文件共享,也可以作为门户中的图层。
您可以连接到以下源作为大数据文件共享:
- Apache Hadoop Distributed File System (HDFS),有或没有 Kerberos 身份验证。
- Apache Hive
- 文件夹和网络共享
- 云存储 - 支持以下内容:
- Amazon S3
- Microsoft Azure Data Lake
- Microsoft Azure Blob 存储
可以使用以下图层作为输入:
- 存储在 ArcGIS Data Store(配置为时空大数据存储或关系数据存储)中的托管要素图层(包括视图)
- 要素服务
- 流服务(这会将分析应用于图层中当前显示的数据)
您可以写入门户中的托管图层,也可以使用模板通过大数据文件共享进行写入。
写入门户中的托管图层时,请指定希望保存到时空数据存储(默认)还是关系数据存储。
您可以通过配置大数据文件共享模板来写入以下数据存储:
- HDFS
- 文件夹和网络共享
- 云存储 - 支持以下内容:
- Amazon S3
- Microsoft Azure Data Lake
请确认以下内容以确保您可以注册大数据文件共享:
- 已将此服务器配置为门户的 GeoAnalytics Server。
- 您正在 GeoAnalytics Server 上使用 Manager。
- 您是发布者、管理员或具有 GeoAnalytics 要素分析权限的用户。
请确保您的 GeoAnalytics Server 运行帐户已被授予对试图注册位置的读取访问权限。要了解有关注册大数据文件共享的详细信息,请参阅使用 Manager 将数据注册到 ArcGIS Server。
如果清单中不包含任何数据集,则可能是以下原因之一导致的:
- 为大数据文件共享选择的位置所包含的文件夹结构不正确。要了解有关正确文件夹结构的详细信息,请参阅使用 Manager 将数据注册到 ArcGIS Server。
- 数据集的格式不符合要求。要了解有关可使用大数据文件共享注册的数据类型,请参阅大数据文件共享入门。
- 如果您将云存储注册为大数据文件共享,请确保在注册云存储时正确指定了您正在使用的文件夹。即使未正确指定文件夹,也会进行云存储验证。
如果您仍然无法将数据集注册为大数据文件共享的一部分,请联系 Esri 支持中心,他们会协助您注册大数据文件共享。
将分隔文件注册为大数据文件共享中的数据集时,GeoAnalytics Server会尝试确定字段名称。根据您的数据,您可能没有字段名称,或者 GeoAnalytics Server无法确定字段名称。这种情况下,您有以下选择:
- 如果您数据集的原始数据中没有标题,您可以在提示文件中设置 fieldNames 参数,上传提示文件并在 Server Manager 中重新生成清单,从而创建标题。
- 如果清单生成错误地假定了数据的分隔符类型,且无法解析字段,请在提示文件中设置 delimiter 参数,上传提示文件并在 Server Manager 中重新生成清单。
- 如果您的数据具有标题行,但未正确识别分隔符,请在提示文件中设置 hasHeaderRow 参数,上传提示文件并在 Server Manager 中重新生成清单。
- 在清单编辑器中手动修改字段名称。
在 Server Manager 中对数据集字段进行可视化检查。如果没有问题,请使用描述数据集工具中的输入。使用此工具可以创建和输入具有相同时间和几何的输入样本、表示数据空间范围的范围图层、输入字段的汇总统计数据以及注册时间和几何的描述。
可以;但有一些注意事项。
如果您的数据显示为要素服务,则可以将其用作工具的输入。但是,如果您使用 GeoAnalytics Server在门户上创建托管要素图层,则可以获得更好的性能。这是因为 GeoAnalytics Server 直接从数据源读取数据。如果您的数据未存储在要素服务中,则可以使用以下选项:
- 如果您在 ArcGIS Pro 中运行工具并且数据较小不复杂(例如几百个点),您可以直接在 ArcGIS Pro 中将数据用作工具的输入。在大多数情况下,建议您首先将数据共享为托管要素图层。
- 使用存储在文件地理数据库中的数据时,必须将您的数据复制到 GeoAnalytics Server,然后才能完成分析。这可能需要很长时间,且在某些情况下无法完成,具体取决于数据的大小。
运行 GeoAnalytics Server
要确定 GeoAnalytics Server 作业是否正在运行,请执行以下任意操作:
- 在 GeoAnalytics Server上的 Server Manager 中,使用作业选项卡查看作业。
- 单击 admin > services > System > GeoAnalyticsTools.GPServer > jobs,在 GeoAnalytics ServerAdministrator Directory 中查看作业。
- 在 GeoAnalytics Server health check 中查看 activeapps。
除了在 ArcGIS Pro 或 Map Viewer 中单击取消外,您还可以使用以下选项之一来取消 GeoAnalytics Server 作业:
- 在 GeoAnalytics Server的 Server Manager 中,请使用作业选项卡。
- 在 GeoAnalytics Server Administrator Directory 中,单击 admin > services > System > GeoAnalyticsTools.GPServer > jobs,查询正在运行的作业并取消作业。
GeoAnalytics 工具集 运行失败
运行另一个工具以查看是否会发生相同的错误。在大多数情况下,最好联系 Esri 支持部门,这样他们可以帮助您隔离问题的诱因。该问题可能与您使用的参数、输入图层或分布式计算平台服务错误有关。如果您认为可能是计算平台服务错误,则您的管理员可以重置 Zookeeper。联系 Esri 支持中心时,请备注正在使用的参数,以及其它 GeoAnalytics Server 工具是否已成功运行。
正在运行的作业所需要的资源超出了 GeoAnalytics Server 中提供的资源。可能为以下原因:
- 您已经在 GeoAnalytics Server 上运行了 GeoAnalytics 工具集,因此资源无法用于新的作业。如果是这种情况,请在开始新作业之前取消当前作业或等待其完成。
- 您可能使用了不正确的资源量设置。要查看计算机上可用的和作业所请求的 RAM 数量和内核数,请使用 GeoAnalytics Server设置。
- Spark 可能存在问题。如果您排除了上述情况,请尝试通过 Server Manager 重新启动 GeoAnalytics 工具集。
要诊断此问题,请查看 GeoAnalytics Server 上 Administrator Directory 中的 Spark 状态。如果您看到一台或多台计算机列为 UNKNOWN 或 STOPPED,可通过在 GeoAnalytics Server 上的 Administrator Directory 中单击计算机 > <计算机名> > 状态来检查计算机的状态。如果您的计算机可用,请通过以下步骤重新启动 GeoAnalytics Server:
- 请停止组成 GeoAnalytics Server 站点的所有计算机上的 ArcGIS Server 服务。在 Windows 上,停止 ArcGIS Server Windows 服务。在 Linux 上,使用 stopserver.sh 脚本停止所有计算机。
- 请等待五分钟。
- 启动 GeoAnalytics Server站点内所有计算机上的 ArcGIS Server 服务。在 Windows 上,启动 ArcGIS Server Windows 服务。在 Linux 上,使用 startserver.sh 脚本启动所有计算机。
- 请等待两分钟。然后运行 GeoAnalytics 作业。如果无法正常运行,请继续步骤 5。
- 检查计算平台服务的状态。为此,请参考以下步骤。
在检查状态时,如果无法连接到一台或多台计算机,则一台或多台计算机中断。其可能原因为计划中断或计划外中断(例如升级或修补程序)。要在此状态下临时运行 GeoAnalytics 工具集,请完成以下步骤:
- 以管理员身份登录到 ArcGIS Server的 GeoAnalytics Server Administrator Directory。
- 转至 system > platformservices > Zookeeper (Synchronization_Service) > reset 并单击“重置”按钮。
- 转至 system > platformservices > Spark (Compute_Platform) > start 并单击“启动”按钮。
计算平台服务可在 GeoAnalytics Server 上的 ArcGIS Server Administrator Directory 中启动。请通过以下步骤来重启计算平台服务:
- 以管理员身份登录到 ArcGIS Server的 GeoAnalytics Server Administrator Directory。
- 转至 system > platformservices > Spark (Compute_Platform) > stop 并单击“停止”按钮。
- 转至 system > platformservices > Zookeeper (Synchronization_Service) > stop 并单击“停止”按钮。
- 请等待五分钟。
- 转至 systemplatformservices > Zookeeper (Synchronization_Service) > start 并单击“启动”按钮。
- 转至 system > platformservices > Spark (Compute_Platform) > start 并单击“启动”按钮。
- 等待两分钟让计算机启动。
- 转至 system > platformservices > Spark (Compute_Platform) > status,然后检查所有计算机的 configuredState 和 realtimeState 状态是否均为 started。
如果平台服务无法启动,请联系 Esri 支持。
如果您通过 ArcGIS REST API 或 ArcGIS Pro 运行此作业,则您可能已收到一条附加消息服务 'System/GeoAnalyticsTools.GPServer' 处理请求超时 当您正在运行的作业所花费的时间超出了 GeoAnalytics Server 的超时限制时,会发生此错误。要解决此问题,请增加超时时间。有关详细信息,请参阅 GeoAnalytics 设置。
使用 HTTPS URL 时,请确认该图层的 URL 未使用自签名证书。
仅可对拥有所有所需分析信息的大数据文件共享运行分析。在 ArcGIS Pro 中,这表示您的大数据文件共享清单包括几何和空间参考。如果数据集包括时间,则除角色外,必须具有表示时间的字段。要了解有关大数据文件共享的详细信息,请参阅了解大数据文件共享清单。