Skip To Content

使用 ArcGIS GeoAnalytics Server 执行大数据分析

ArcGIS GeoAnalytics Server 拥有 ArcGIS Enterprise 的大数据处理和分析功能。它所提供的分布式计算框架可为进行大量数据分析的一系列分析工具提供支持。通过聚合、回归、检测、聚类等等,您可以可视化、理解和处理大数据。借助 GeoAnalytics Server, 您可以洞察可能隐藏在数据中的模式、趋势和异常等。

ArcGIS GeoAnalytics Server 拥有 ArcGIS Enterprise 的大数据处理和分析功能。它所提供的分布式计算框架可为进行大量数据分析的一系列分析工具提供支持。通过聚合、回归、检测、聚类等等,您可以可视化、理解和处理大数据。借助 GeoAnalytics Server, 您可以洞察可能隐藏在数据中的模式、趋势和异常等。

GeoAnalytics 工具进行分析的示例适用于各行各业。以下示例说明如何使用 GeoAnalytics Server 来实现不同目标:

  • 作为犯罪分析师,您可以了解所在州发生犯罪的地点和时间,以及事件、警察局和市中心等感兴趣区域附近犯罪活动的邻近性。相关工具包括“聚合点”和“连接要素”。
  • 作为州交通运输部门的管理人员,您可以分析数十年的交通和碰撞数据,以确定交通事故最多的州际公路。您还可以分析某些车辆何时加速和超速,并将此数据与车辆事故的位置关联起来。相关工具包括“查找点聚类”和“重新构建轨迹”。
  • 作为环境科学家,您可以在数百万静态传感器读数的数据集中识别全国范围内达到高臭氧水平的时间和位置。相关工具包括“检测事件”和“创建时空立方体”。
  • 作为电力公用设施工程师,您可以确定雷击位置与电气线路和变电站的接近程度。相关工具包括“创建缓冲区”和“连接要素”。
  • 作为自来水公共设施技术人员,您可以对有关查找泄漏的工作单进行排序,并将其连接至土壤类型数据集,以确定具有较强腐蚀性土壤的区域是否发生泄漏。相关工具包括“创建时空立方体”和“查找热点”。
  • 作为零售潜在客户,您可以根据人口统计数据、过往销售额或与商店之间的距离来重新调整您的交易区域。您还可以看到商店业绩在您的产品组合中的相似程度和差异程度。相关工具包括“融合边界”和“查找相似位置”。
  • 作为城市 GIS 分析师,您可以使用 ArcGIS GeoEvent Server 获取所有城市车辆(例如公共事业部车辆和除雪车)上的 GPS 数据。查看车辆行驶轨迹、覆盖范围较小的区域以及车辆超速情况。相关工具包括“重新构建轨迹”、“聚合点”和“检测事件”。

访问 GeoAnalytics 工具

可以在 Map ViewerArcGIS ProArcGIS API for Python 中使用的以及通过 ArcGIS REST API 使用的 ArcGIS GeoAnalytics Server 的要素分析工具。作为门户成员,您可以使用以下步骤访问工具。

有关通过 ArcGIS REST API 运行工具的信息,请参阅 ArcGIS REST API 文档。有关在 ArcGIS Pro 中运行工具的详细信息,请参阅 ArcGIS Pro 文档。

Map Viewer 中访问工具

  1. 以具有 GeoAnalytics 要素分析权限的成员身份登录到门户。
  2. 单击地图以打开 Map Viewer
  3. 单击分析并选择 GeoAnalytics 工具
注:

如果在 Map Viewer 中没有看到分析按钮或 GeoAnalytics 工具选项卡,请联系您的门户管理员。可能无法为您的门户配置 ArcGIS GeoAnalytics Server,或者您不具备运行工具的权限。如果您不具备工具所要求的权限,则无法看到工具。

ArcGIS API for Python 中访问工具

通过 ArcGIS API for Python,GIS 分析师和数据科学家可以使用其组织中提供的强大 GeoAnalytics 工具 查询、显示、分析和变换空间数据。要了解有关 API 的分析功能的更多信息,请参阅文档站点

大数据分析工具可通过 geoanalytics 模块进行访问。

准备用于分析的数据

可针对下列对象运行 GeoAnalytics 工具

  • (托管、托管要素图层视图以及来自要素服务的)要素图层
  • 要素集合
  • 大数据文件共享已注册到 ArcGIS GeoAnalytics Server

GeoAnalytics 工具 输出

通过运行 GeoAnalytics 工具 得到的输出可以是以下两个选项之一:

  • 托管要素图层,其中数据存储在注册到门户托管服务器的 ArcGIS Data Store 中。
  • 存储至注册到 GeoAnalytics Server 的大数据文件共享(文件夹、云存储、HDFS 位置)的数据集。

工具概述

下面对每个工具进行了概述。分析工具按类别排列。这些类别为逻辑分组,不会对工具的访问或使用方式造成任何影响。

汇总数据

这些工具用于计算区域内或其他要素附近的要素及其属性的总数、长度、面积以及基本描述性统计数据。

工具术语

聚合点

聚合点

该工具使用点要素的图层,以及区域要素的图层或者用于计算图格的距离来确定各区域内的点并计算各区域内所有点的统计数据。也可以选择将时间切片应用于此工具。

以下是使用此工具的示例场景:

  • 给定犯罪事件的点位置并计算每个县或其他行政区的犯罪数。
  • 使用 100 km 条柱来查找特许经营位置的最高月收入和最低月收入。

构建多变量格网

构建多变量格网

“构建多变量格网”工具会生成正方形或六边形图格,并根据一个或多个输入图层的邻近性计算每个图格的变量。

以下是使用此工具的示例场景:

  • 已知多个公共交通基础设施图层,城市的哪个区域公共交通最不便利?
  • 已知水道(例如湖泊和河流)图层,最接近美国各区域的水体名称是什么?
  • 已知家庭收入图层,美国哪个位置周围 50 英里范围内收入差距最大?

描述数据集

描述数据集

描述数据集可输出要素样本和范围图层、计算汇总统计数据,并概述输入图层属性。

以下是使用此工具的示例场景:

  • 给定包含 20 亿个要素的数据集,创建包含 1000 个要素的样本图层,以有效地可视化和检查地图中的要素。通过查看输出汇总统计数据表来检查完整数据集的汇总统计数据。
  • 给定由 40 个单独 CSV 文件组成的大数据文件共享数据集,输出范围图层以表示输入要素的空间离散,而不在地图上绘制所有这些要素。查看输出 JSON 概述以查看空间参考、几何类型和记录计数。

连接要素

“连接要素”工具

使用一个点、线或面要素的图层或者表,以及另一点、线或面要素的图层或者表来连接显示特定关系的要素。空间、时态和属性关系可用于连接要素,也可以用于计算汇总统计数据。

以下是使用此工具的示例场景:

  • 给定带有时间的犯罪事件的点位置,将犯罪数据与其本身进行连接,指定 1 平方公里内的犯罪以及 1 小时内所发生犯罪的空间关系,以确定是否存在空间和时间上彼此接近的犯罪序列。
  • 给定具有人口统计信息的邮政编码表和表示住宅建筑物的区域要素,将人口统计信息连接到住宅,以使各个住宅现在具有信息。

重新构建轨迹

重建轨迹

此工具使用已启用时间的点要素或面要素的图层,按时间对输入进行顺序排序,可以确定属于轨迹的输入要素。然后计算每个轨迹内所有输入要素的统计数据。

以下是使用此工具的示例场景:

  • 已知飓风测量的点位置和时间,计算飓风的平均风速和最大风压。

汇总属性

汇总属性

此工具使用要素或表格数据来汇总字段的统计数据。

以下是使用此工具的示例场景:

  • 给定具有字段 COMPANY_NAME 的杂货店位置,按照公司名称汇总杂货店,以确定每家公司的统计数据。
  • 给定具有字段 COMPANY_NAME 和 COUNTY 的杂货店表,按照公司名称和县汇总杂货店,以确定县中各个公司的统计数据。

范围内汇总

范围内汇总

此工具用于查找两个图层间叠加的区域(和部分区域)并计算叠加的统计数据。

以下是使用此工具的示例场景:

  • 给定流域图层和按土地使用类型划分的土地使用区域图层,计算每个流域的土地使用类型的总面积。
  • 已知县内宗地的图层和城市边界图层,汇总各城市内闲置宗地的平均值。

查找位置

这些工具用于查找传递任意指定数量条件的要素。它们通常用于地点选择,目标是查找满足多个条件的地点。

工具术语

检测事件

检测事件

此工具使用启用时间点、线、面图层或表,这个图层或表可表示时间上的某个瞬间。通过按顺序排列的要素(称为轨迹),该工具可确定哪些要素是感兴趣的事件。事件由您指定的条件确定。

以下是使用此工具的示例场景:

  • 给定一个每隔 10 分钟进行一次飓风 GPS 测量的图层。每个 GPS 测量记录了飓风的名称、位置、记录时间和风速。通过这些字段,可以创建一个事件,其中所有风速超过 208 km/h 的测量结果将标记为 Catastrophic。
  • 给定一个传感器测量图层,当值超过先前三个值的平均值时,则创建一个事件。

查找相似位置

查找相似位置

根据您所指定的条件,“查找相似位置”工具将测量候选搜索图层中的位置与一个或多个参考位置之间的相似性。

以下是使用此工具的示例场景:

  • 通过检查员工数量和年销售额,查找十个最相似的商店。
  • 通过检查人口、年增长率和税收之间的关系,找到 100 个最相似的城市。

对表格中的位置进行地理编码

对表格中的位置进行地理编码

此工具可将地址转换为坐标。在大数据文件共享表上使用该工具。

以下是使用此工具的示例场景:

  • 对表示犯罪地点地址的多个 CSV 进行地理编码,以浏览犯罪热点。
  • 对表示在线零售商配送位置的文本文件进行地理编码,以确定可高效开展营销工作的位置。

数据丰富

这些工具可帮助您浏览数据特征。通过从其他数据源中丰富信息来将信息添加到输入数据中。

从多变量格网丰富

从多变量格网丰富

此工具将多变量格网中的属性连接到点图层,从而快速地将多样的大型信息集合添加到点数据,以便在空间分析中进一步使用。

以下是使用此工具的示例方案:

  • 假设您拥有一个包含数百万次停电事件的图层,您可以使用主要用途、环境风险和基础设施状况等信息丰富事件要素,以研究这些因素和停电频率之间的关系。

分析模式

这些工具可帮助您确定、量化并显示数据的空间模式。

工具术语

计算密度

计算密度

“计算密度”工具用于通过将某种现象的已知量(表示为点的属性)散布到整个地图上以从点要素创建密度地图。结果是表示密度的区域图层。

以下是使用此工具的示例场景:

  • 计算某县的医院密度。结果图层将显示容易到达医院和不容易到达医院的区域,此信息可用于确定新建医院的位置。
  • 根据发生森林火灾的历史位置确定森林火灾的高风险区域。
  • 查找距离主要高速公路较远的社区以计划应修建新道路的位置。

查找热点

查找热点

查找热点工具可以确定数据在空间模式方面是否存在任何统计显著性的聚类。

以下是此工具可以帮助您回答的示例问题:

  • 各个点要素(犯罪事件、树木、交通事故)是否可进行聚类? 您又是如何确定的?
  • 您是否发现了具有统计显著性的热点(消费、婴儿死亡率、长期保持高测试分数)?或者说如果更改地图的符号化方式,地图会呈现出另一种结果吗?

查找点聚类

查找点聚类

查找点聚类工具可基于点要素的空间分布查找周围噪点内的点要素聚类。

以下是使用此工具的示例场景:

  • 查找受害虫危害的家庭的聚类,以帮助确定根除目标。
  • 根据使用自然灾害或恐怖袭击之后的地理定位推文确定的聚类大小和位置,报告救援和疏散需求并采取行动。

基于森林的分类与回归

基于森林的分类与回归

基于森林的分类与回归工具可使用 Leo Breiman 随机森林算法(一种监督式机器学习方法)的改编版本创建模型并生成预测

以下是使用此工具的示例场景:

  • 给定有关海草是否存在的数据,以及许多环境解释变量(此变量已使用多变量格网进行丰富,以计算距上游工厂和主要港口的距离),使用此工具根据对环境解释变量的预测来推断未来是否存在海草。
  • 从全国数百个农场,以及每个农场的其他属性(员工人数、占地面积等)收集作物产量数据。可使用这些数据提供表示没有作物产量(但确实拥有所有其他变量)的农场的要素集,然后对作物产量进行预测。
  • 可根据当年已售房屋的价格来预测房屋价值。可使用已售房屋的售价以及有关卧室数量、距学校的距离、与主要高速公路的接近度、平均收入和犯罪计数的信息预测类似房屋的售价。

广义线性回归

裁剪图层

概化线性回归工具可生成预测,也可为一个因变量针对它与一组解释变量关系建模。此工具可用于拟合连续 (OLS)、二进制(逻辑)和计数(泊松)模型。

以下是此工具可以帮助您回答的示例问题:

  • 哪些人口特征导致了较高的公共交通工具使用率?
  • 财产破坏的行为数与盗窃数之间是否存在明确的关系?
  • 哪些变量可有效预测 911 呼叫数? 鉴于对未来的预测,对应急资源的预期需求有哪些?
  • 哪些变量会影响低出生率?

地理加权回归

地理加权回归

地理加权回归 (GWR) 工具可应用用于建模空间变化关系的线性回归的局部形式。

以下是此工具可以帮助您回答的示例问题:

  • 整个研究区域的教育程度和收入之间的关系是否一致?
  • 有哪些关键可变因素可以解释森林火灾频发的原因?
  • 哪些学区的孩子会取得高测试分数? 似乎与哪些特征联系在一起? 每个特征分别在哪些地方最为重要?

创建时空立方体

创建时空立方体

该工具可通过将一组启用时间的点聚合到时空条柱的方法将其汇总到 netCDF 结构中。

以下是使用此工具的示例场景:

  • 将城市中的所有犯罪按月份聚合到 1-km 条柱中。
  • 将过去 50 年内某县拨打的所有 911 报警电话聚合到包含每年时态条柱的 100-km 条柱中。
注:

创建时空立方体无法通过 Map Viewer 运行。要使用创建时空立方体工具,请通过 ArcGIS REST APIArcGIS Pro 运行。

邻近分析

这些工具可帮助您回答在空间分析中提出的一个最普遍问题:什么在什么附近?

工具术语

创建缓冲区

创建缓冲区

缓冲区是一个以点、线或面要素为起点覆盖给定距离的区域。

以下是使用此工具的示例场景:

  • 使用线状河流要素,按河流宽度的 50 倍对每条河流进行缓冲,以确定拟建河岸边界。
  • 已知表示国家的区域,按 200 海里对每个国家进行缓冲,以确定海岸边界。

管理数据

这些工具用于地理数据和表格数据的日常管理。

工具术语

追加数据

追加数据

此工具可将点、线、区域或表格数据集附加到几何类型相同的现有托管要素图层。

以下是使用此工具的示例场景:

  • 给定每月生成的多个数据集,将数据集附加到托管要素图层,以将数据合并到年度报告中。
  • 给定 10 个包含来自不同源的气候测量值的数据集,附加数据集以创建气候测量值的单个图层。使用字段映射更正每个源的方案差异。

计算字段

计算字段

此工具可计算新字段或现有字段的值,并在 ArcGIS Enterprise 的内容中创建图层。

以下是使用此工具的示例场景:

  • 将名为 total 的现有字段修改为字段 total_2016total_2017total_2018 的收益总和。
  • 创建一个新字段,以基于字段值(例如 windspeedpollutant)对危险级别进行分类。

裁剪图层

裁剪图层

裁剪图层从指定区域提取输入图层要素的子集,以创建包含该子集的图层。

以下是使用此工具的示例场景:

  • 给定包含国家地震发生数据的要素图层,使用加利福尼亚州边界图层以仅提取覆盖加利福尼亚的地震。
  • 给定一个从高速公路延伸 50 英尺的缓冲图层,剪裁受高速公路延伸影响的森林要素。

复制到数据存储

复制到数据存储

此工具将输入要素图层或表复制到 ArcGIS Data Store 并在 Web GIS 中创建一个图层。

以下是使用此工具的示例场景:

  • 将大数据文件共享中的 CSV 文件集合复制到时空数据存储以进行可视化。
  • 将存储在时空数据存储中的当前地图范围内的要素复制到关系数据存储中。

融合边界

融合边界

融合边界可查找并合并空间相交或共享相同字段值的区域要素。

以下是使用此工具的示例场景:

  • 给定研究区域的要素图层,合并具有相同土壤类型值的所有要素,以创建按土壤类型表示区域的图层。
  • 给定受限区域和缓冲区域,将所有要素融合在一起,以汇总不适合进行开发的地点。

合并图层

“合并图层”工作流示意图

此工具可合并两个数据集以创建一个单独的输出图层。使用合并属性以确定生成的方案。

以下是使用此工具的示例场景:

  • 给定英格兰、威尔士和苏格兰的要素图层,合并图层以创建英国的单个要素图层。
  • 两个要素图层代表相邻的乡镇,每个乡镇具有不同的字段名称。使用属性规则合并图层以与字段相匹配,并输出具有所需方案的单个图层。

叠加图层

叠加图层

叠加图层将两个或多个图层合并为一个图层。

以下是此工具可以帮助您回答的示例问题:

  • 哪些宗地位于百年一遇的洪泛区中? (“在...中”是“在...上”的另一种表达方式。)
  • 什么土地利用在什么土壤类型上?
  • 什么井在废弃的军事基地中?