Skip To Content

使用 ArcGIS GeoAnalytics Server 执行大数据分析

ArcGIS GeoAnalytics Server 提供 ArcGIS Enterprise 的大数据处理和分析功能。 它所包括的分布式计算框架可为进行大量数据分析的一系列分析工具提供支持。 通过聚合、回归、检测、聚类等等,您可以可视化、理解和使用大数据。 使用 GeoAnalytics Server,您可以洞察可能隐藏在数据中的模式、趋势和异常等。

GeoAnalytics 工具进行分析的示例适用于各行各业。 以下示例描述如何使用 GeoAnalytics Server 来实现不同目标:

  • 作为犯罪分析师,您可以了解所在州发生犯罪的地点和时间,以及事件、警察局和市中心等感兴趣区域附近犯罪活动的邻近性。 相关工具包括“聚合点”和“连接要素”。
  • 作为州交通运输部门的管理人员,您可以分析数十年的交通和碰撞数据,以确定交通事故最多的州际公路。 您还可以分析某些车辆何时加速和超速,并将此数据与车辆事故的位置关联起来。 相关工具包括“查找点聚类”和“重新构建轨迹”。
  • 作为环境科学家,您可以在数百万静态传感器读数的数据集中识别全国范围内达到高臭氧水平的时间和位置。 相关工具包括“检测事件”和“创建时空立方体”。
  • 作为电力公用设施工程师,您可以确定雷击位置与电气线路和变电站的接近程度。 相关工具包括“创建缓冲区”和“连接要素”。
  • 作为自来水公共设施技术人员,您可以对有关查找泄漏的工作单进行排序,并将其连接至土壤类型数据集,以确定具有较强腐蚀性土壤的区域是否发生泄漏。 相关工具包括“创建时空立方体”和“查找热点”。
  • 作为零售潜在客户,您可以根据人口统计数据、过往销售额或与商店之间的距离来重新调整您的交易区域。 您还可以看到商店业绩在您的产品组合中的相似程度和差异程度。 相关工具包括“融合边界”和“查找相似位置”。
  • 作为城市 GIS 分析师,您可以使用 ArcGIS GeoEvent Server 分析所有城市车辆(例如公共事业部车辆和除雪车)上的 GPS 数据。 查看车辆行驶轨迹、覆盖范围较小的区域以及车辆超速情况。 相关工具包括“重新构建轨迹”、“聚合点”和“检测事件”。

访问 GeoAnalytics Tools

可以在 Map Viewer 经典版ArcGIS ProArcGIS API for Python 中以及通过 ArcGIS REST API 使用 ArcGIS GeoAnalytics Server 中的要素分析工具。 作为门户成员,您可以使用以下步骤访问工具。

有关通过 ArcGIS REST API 运行工具的信息,请参阅 ArcGIS REST API 文档。 有关在 ArcGIS Pro 中运行工具的详细信息,请参阅 ArcGIS Pro 文档。

Map Viewer 经典版 中访问工具

可以使用以下步骤从 Map Viewer 经典版 中访问工具:

  1. 以具有 GeoAnalytics 要素分析权限的成员身份登录到门户。
  2. 单击地图以打开 Map Viewer 经典版
  3. 单击分析并选择 GeoAnalytics 工具
注:

如果在 Map Viewer 经典版 中没有看到分析按钮或 GeoAnalytics 工具选项卡,请联系您的门户管理员。 可能无法为您的门户配置 ArcGIS GeoAnalytics Server,或者您不具备运行工具的权限。 如果您不具备工具所要求的权限,则无法看到工具。

ArcGIS API for Python 中访问工具

GIS 分析师和数据科学家可通过 ArcGIS API for Python 使用其组织中提供的 GeoAnalytics Tools 来查询、显示、分析并变换其空间数据。 要了解有关 API 的分析功能的更多信息,请参阅文档站点

您可以通过 geoanalytics 模块访问大数据分析工具。

准备用于分析的数据

可针对以下项目运行 GeoAnalytics Tools

  • (托管、托管要素图层视图以及来自要素服务的)要素图层
  • 要素集合
  • 大数据文件共享已注册到 ArcGIS GeoAnalytics Server

GeoAnalytics Tools 输出

通过运行 GeoAnalytics Tools 得到的输出可以是以下两个选项之一:

  • 托管要素图层,其中数据存储在注册到门户托管服务器的 ArcGIS Data Store 中。
  • 存储至注册到 GeoAnalytics Server 的大数据文件共享(文件夹、云存储、HDFS 位置、Hive)的数据集。

工具概览

下面对每个工具进行了概述。 分析工具按类别排列。 这些类别为逻辑分组,不会对工具的访问或使用方式造成任何影响。

汇总数据

这些工具计算区域内或其他要素附近的要素及其属性的总数、长度、面积以及基本描述性统计数据。

工具描述

聚合点

聚合点

该工具使用点要素的图层,以及区域要素的图层或者用于计算图格的距离来确定各区域内的点并计算各区域内所有点的统计数据。 也可以选择将时间切片应用于此工具。

以下是使用此工具的示例场景:

  • 给定犯罪事件的点位置并计算每个县或其他行政区的犯罪数。
  • 使用 100 km 条柱来查找特许经营位置的最高月收入和最低月收入。

构建多变量格网

构建多变量格网

该工具将生成正方形和六边形图格格网,并根据一个或多个输入图层的邻近性计算每个图格的变量。

以下是使用此工具的示例场景:

  • 已知多个公共交通基础设施图层,城市的哪个区域公共交通最不便利?
  • 已知水道(例如湖泊和河流)图层,最接近美国各区域的水体名称是什么?
  • 已知家庭收入图层,美国哪个位置周围 50 英里范围内收入差距最大?

描述数据集

描述数据集

此工具将输出要素样本和范围图层、计算汇总统计数据,并概述输入图层属性。

以下是使用此工具的示例场景:

  • 给定包含 20 亿个要素的数据集,创建包含 1000 个要素的样本图层,以有效地可视化和检查地图中的要素。 通过查看输出汇总统计数据表来检查完整数据集的汇总统计数据。
  • 给定由 40 个单独 CSV 文件组成的大数据文件共享数据集,输出范围图层以表示输入要素的空间离散,而不在地图上绘制所有这些要素。 查看输出 JSON 概述以查看空间参考、几何类型和记录计数。

连接要素

“连接要素”工具

使用一个点、线或面要素的图层或者表,以及另一点、线或面要素的图层或者表来连接显示特定关系的要素。 空间、时态和属性关系可用于连接要素,也可以用于计算汇总统计数据。

以下是使用此工具的示例场景:

  • 给定带有时间的犯罪事件的点位置,将犯罪数据与其本身进行连接,指定 1 平方公里内的犯罪以及 1 小时内所发生犯罪的空间关系,以确定是否存在空间和时间上彼此接近的犯罪序列。
  • 给定具有人口统计信息的邮政编码表和表示住宅建筑物的区域要素,将人口统计信息连接到住宅,以使各个住宅现在具有信息。

重新构建轨迹

重新构建轨迹

此工具使用已启用时间的点要素或面要素的图层,按时间对输入进行顺序排序,可以确定属于轨迹的输入要素。 然后计算每个轨迹内所有输入要素的统计数据。

以下是使用此工具的示例场景:

  • 已知飓风测量的点位置和时间,计算飓风的平均风速和最大风压。

汇总属性

汇总属性

此工具使用要素或表格数据来汇总字段的统计数据。

以下是使用此工具的示例场景:

  • 给定具有字段 COMPANY_NAME 的杂货店位置,按照公司名称汇总杂货店,以确定每家公司的统计数据。
  • 给定具有字段 COMPANY_NAME 和 COUNTY 的杂货店表,按照公司名称和县汇总杂货店,以确定县中各个公司的统计数据。

汇总中心和离差

汇总中心和离差

该工具用于查找中心要素和方向分布。

以下为示例:

  • 点数据集的地理中心在哪里?
  • 与其他所有要素相比,哪个要素最便利?
  • 要素的分散程度、密集程度或整合程度如何?
  • 是否存在方向趋势?

注:

无法通过 Map Viewer 经典版 运行“汇总中心和离差”工具。 要使用“汇总中心和离差”工具,请通过 ArcGIS REST APIArcGIS Pro 运行该工具。

范围内汇总

范围内汇总

此工具用于查找两个图层间叠加的区域(和部分区域)并计算叠加的统计数据。

以下是使用此工具的示例场景:

  • 按土地使用类型给定分水岭区域图层和土地使用区域图层,计算每个分水岭的土地使用类型的总面积。
  • 已知县内宗地的图层和城市边界图层,汇总各城市内闲置宗地的平均值。

查找位置

这些工具用于查找传递任意指定数量条件的要素。 它们通常用于地点选择,目标是查找满足多个条件的地点。

工具描述

检测事件

检测事件

此工具使用点、线、面或表的启用了时间的图层,该图层在时间上可表示时刻。 通过按顺序排列的要素(称为轨迹),该工具可确定哪些要素是感兴趣的事件。 事件由您指定的条件确定。

以下是使用此工具的示例场景:

  • 给定一个每隔 10 分钟进行一次飓风 GPS 测量的图层。 每个 GPS 测量记录了飓风的名称、位置、记录时间和风速。 通过这些字段,可以创建一个事件,其中所有风速超过 208 km/h 的测量结果将标记为 Catastrophic。
  • 给定一个传感器测量图层,当值超过先前三个值的平均值时,则创建一个事件。

查找停留位置

查找停留位置

使用启用时间的点要素图层,此工具可确定一段时间内轨迹要素在一定距离内停留的位置。

以下是使用此工具的示例场景:

  • 检查动物的运动模式,以根据动物所处的位置确定潜在的保护区。
  • 改善车辆处于空闲状态的区域的交通管制。

查找相似位置

查找相似位置

根据您所指定的条件,“查找相似位置”工具将测量候选搜索图层中的位置与一个或多个参考位置之间的相似性。

以下是使用此工具的示例场景:

  • 通过检查员工数量和年销售额,查找十个最相似的商店。
  • 通过检查人口、年增长率和税收,查找 100 个最相似的城市。

对表格中的位置进行地理编码

对表格中的位置进行地理编码

此工具可将地址转换为坐标。 在大数据文件共享表上使用该工具。

以下是使用此工具的示例场景:

  • 对表示犯罪地点地址的多个 CSV 进行地理编码,以浏览犯罪热点。
  • 对表示在线零售商配送位置的文本文件进行地理编码,以确定可高效开展营销工作的位置。

数据丰富

这些工具可帮助您浏览数据特征。 通过从其他数据源中丰富信息来将信息添加到输入数据中。

计算动态统计数据

计算动态统计数据

该工具用于计算启用时间且时间类型为时刻的要素的动态统计数据和测量值组。 统计数据和测量值均基于通过唯一标识符确定的轨迹。 计算组包括距离、速度、加速度、持续时间、高程、坡度、空闲和方位角,具体取决于提供的时间值和基于点的事件的几何。

以下是使用此工具的示例场景:

  • 城市正在监控扫雪车作业,并希望更好地了解车辆的运行情况。 该工具可用于确定空闲位置和空闲时间、随时间变化的平均速度和最大速度、总行驶距离以及其他统计数据。

从多变量格网丰富

从多变量格网丰富

此工具将多变量格网中的属性连接到点图层,从而快速地将多样的大型信息集合添加到点数据,以便在空间分析中进一步使用。

以下是使用此工具的示例方案:

  • 假设您拥有一个包含数百万次停电事件的图层,您可以使用主要用途、环境风险和基础设施状况等信息丰富事件要素,以研究这些因素和停电频率之间的关系。

分析模式

这些工具可帮助您确定、量化并显示数据的空间模式。

工具描述

计算密度

计算密度

此工具用于通过将某种现象的已知量(表示为点的属性)散布到整个地图上以从点要素创建密度地图。 结果是表示密度的面图层。

以下是使用此工具的示例场景:

  • 计算某县的医院密度。 结果图层将显示容易到达医院和不容易到达医院的区域,此信息可用于确定新建医院的位置。
  • 根据发生森林火灾的历史位置确定森林火灾的高风险区域。
  • 查找距离主要高速公路较远的社区以计划应修建新道路的位置。

查找热点

查找热点

此工具可以确定数据在空间模式方面是否存在任何统计显著性的聚类。

以下是此工具可以帮助您回答的示例问题:

  • 各个点要素(犯罪事件、树木、交通事故)是否可进行聚类? 您又是如何确定的?
  • 您是否发现了具有统计显著性的热点(消费、婴儿死亡率、长期保持高测试分数)?或者说如果更改地图的符号化方式,地图会呈现出另一种结果吗?

查找点聚类

查找点聚类

此工具可基于点要素的空间分布查找周围噪点内的点要素聚类。

以下是使用此工具的示例场景:

  • 查找受害虫危害的家庭的聚类,以帮助确定根除目标。
  • 根据使用自然灾害或恐怖袭击之后的地理定位推文确定的聚类大小和位置,报告救援和疏散需求并采取行动。

基于森林的分类与回归

基于森林的分类与回归

此工具可使用 Leo Breiman 随机森林算法(一种监督式机器学习方法)的改编版本生成预测并对其进行建模。

以下是使用此工具的示例场景:

  • 给定有关海草是否存在的数据,以及许多环境解释变量(此变量已使用多变量格网进行丰富,以计算距上游工厂和主要港口的距离),使用此工具根据对环境解释变量的预测来推断未来是否存在海草。
  • 从全国数百个农场,以及每个农场的其他属性(员工人数、占地面积等)收集作物产量数据。 可使用这些数据提供表示没有作物产量(但确实拥有所有其他变量)的农场的要素集,然后对作物产量进行预测。
  • 可根据当年已售房屋的价格来预测房屋价值。 可使用已售房屋的售价以及有关卧室数量、距学校的距离、与主要高速公路的接近度、平均收入和犯罪计数的信息预测类似房屋的售价。

广义线性回归

裁剪图层

此工具可生成预测,也可根据因变量与一组解释变量的关系对其进行建模。 此工具可用于拟合连续 (OLS)、二进制(逻辑)和计数(泊松)模型。

以下是此工具可以帮助您回答的示例问题:

  • 哪些人口统计特征会导致公共交通使用率增高?
  • 财产破坏的行为数与盗窃数之间是否存在明确的关系?
  • 哪些变量可有效预测 911 呼叫数? 根据未来的预测,针对应急响应资源的预期需求会是什么?
  • 哪些变量会影响低出生率?

地理加权回归

地理加权回归

该工具将应用用于建模空间变化关系的线性回归的局部形式。

以下是此工具可以帮助您回答的示例问题:

  • 整个研究区域的教育程度和收入之间的关系是否一致?
  • 能够解释森林火灾频繁发生的关键变量是什么?
  • 哪些学区的孩子会取得高测试分数? 似乎与哪些特征联系在一起? 每种特征最重要的地方在哪里?

创建时空立方体

创建时空立方体

该工具可通过将一组启用时间的点聚合到时空条柱的方法将其汇总到 netCDF 结构中。

以下是使用此工具的示例场景:

  • 将城市中的所有犯罪按月份聚合到 1-km 条柱中。
  • 将过去 50 年内某县拨打的所有 911 报警电话聚合到包含每年时态条柱的 100-km 条柱中。
注:

无法通过 Map Viewer 经典版 运行“创建时空立方体”。 要使用“创建时空立方体”,请通过 ArcGIS REST APIArcGIS Pro 运行该工具。

邻近分析

这些工具可帮助您回答在空间分析中提出的一个最普遍问题:什么在什么附近?

工具描述

创建缓冲区

创建缓冲区

缓冲区是一个以点、线或面要素为起点覆盖给定距离的区域。

以下是使用此工具的示例场景:

  • 使用线性河流要素,按河流宽度的 50 倍对每条河流进行缓冲,以确定拟建河岸边界。
  • 给定表示国家的面,按 200 海里对每个国家进行缓冲,以确定海岸边界。

按邻域分组

此工具可对空间邻域或时空邻域内的要素进行分组。

以下是使用此工具的示例场景:

  • 根据空间接近度确定要连接的道路。
  • 揭示在空间和时间上非常接近的犯罪事件组。
  • 识别重叠的面以提高边界的准确性。

注:

无法通过 Map Viewer 经典版 运行“按邻域分组”工具。 要使用“按邻域分组”工具,请通过 ArcGIS REST APIArcGIS Pro 运行该工具。

捕捉轨迹

此工具可将启用时间的点与线要素相匹配。

以下是使用此工具的示例场景:

  • 将配送服务 GPS 轨迹与道路相匹配,以更准确地分析配送路径。
  • 将扫雪机移动数据与道路线相匹配,以确定服务中的间距。

注:

无法通过 Map Viewer 经典版 运行“捕捉轨迹”工具。 要使用“捕捉轨迹”工具,请通过 ArcGIS REST APIArcGIS Pro 运行该工具。

追踪邻域事件

追踪邻域事件

此工具用于分析表示移动实体并且启用时间的点要素。 该任务将追踪感兴趣实体的空间(位置)和时间,以查看与感兴趣实体进行交互的其他实体。 追踪将在实体之间继续,直至达到与原始感兴趣实体的可配置最大分离程度为止。

以下为示例:

  • 假设某个组织会监控公司下发给工作人员进行携带的设备。 该公司想要确定哪些员工在已知患有新冠肺炎的个人附近。 借助表示设备位置和时间的点图层,公司可以标识距离感染者和其他可能感染员工 6 米和 5 分钟范围内的设备。
  • NGO 正在使用 GPS 监控鲑鱼种群,并且想要追踪鲑鱼虱在逃逸的养殖鲑鱼和野生种群之间的传播。 将追踪一些进行 GPS 示踪的养殖鲑鱼,以查看它们是否与示踪的野生种群紧密邻近,以及这些野生种群如何进一步传播这种疾病。

管理数据

这些工具用于地理和表格数据的日常管理。

工具描述

追加数据

追加数据

此工具可将点、线、区域或表格数据集附加到几何类型相同的现有托管要素图层。

以下是使用此工具的示例场景:

  • 给定每月生成的多个数据集,将数据集附加到托管要素图层,以将数据合并到年度报告中。
  • 给定 10 个包含来自不同源的气候测量值的数据集,附加数据集以创建气候测量值的单个图层。 使用字段映射更正每个源的方案差异。

计算字段

计算字段

此工具可计算新字段或现有字段的值,并在 ArcGIS Enterprise 的内容中创建图层。

以下是使用此工具的示例场景:

  • 将名为 total 的现有字段修改为字段 total_2016total_2017total_2018 的收益总和。
  • 创建一个字段,以基于字段值(例如 windspeedpollutant)对危险级别进行分类。

裁剪图层

裁剪图层

该工具可从指定区域提取输入图层要素的子集,以创建包含该子集的图层。

以下是使用此工具的示例场景:

  • 给定包含国家地震发生数据的要素图层,使用加利福尼亚州边界图层以仅提取覆盖加利福尼亚的地震。
  • 给定一个从高速公路延伸 50 英尺的缓冲图层,剪裁受高速公路延伸影响的森林要素。

复制到数据存储

复制到数据存储

此工具将输入要素图层或表复制到 ArcGIS Data Store 并在 Web GIS 中创建一个图层。

以下是使用此工具的示例场景:

  • 将大数据文件共享中的 CSV 文件集合复制到时空数据存储以进行可视化。
  • 将时空数据存储中存储的当前地图范围中的要素复制到关系数据存储。

融合边界

融合边界

该工具可查找并合并空间相交或共享相同字段值的区域要素。

以下是使用此工具的示例场景:

  • 给定研究区域的要素图层,合并具有相同土壤类型值的所有要素,以创建按土壤类型表示区域的图层。
  • 给定受限区域和缓冲区域,将所有要素融合在一起,以汇总不适合进行开发的地点。

合并图层

“合并图层”工作流示意图

此工具可合并两个数据集以创建一个单独的输出图层。 使用合并属性以确定生成的方案。

以下是使用此工具的示例场景:

  • 给定英格兰、威尔士和苏格兰的要素图层,合并图层以创建英国的单个要素图层。
  • 两个要素图层代表相邻的乡镇,每个乡镇具有不同的字段名称。 使用属性规则合并图层以与字段相匹配,并输出具有所需方案的单个图层。

叠加图层

叠加图层

该工具可将两个或多个图层合并成一个图层。

以下是此工具可以帮助您回答的示例问题:

  • 哪些宗地位于百年一遇的洪泛区中? (“在...中”是“在...上”的另一种表达方式。)
  • 什么土地利用在什么土壤类型上?
  • 什么井在废弃的军事基地中?