本教程将介绍设置数据以创建大数据文件共享的步骤。大数据文件共享是在门户中创建的项目,可将可用位置的要素数据(点、折线和多边形)引用到 GeoAnalytics Server。利用门户中的大数据文件共享项目可以浏览已注册的数据,以便您在数据集上运行 GeoAnalytics Tools。创建了大数据文件共享后,您将使用聚合点工具获取数据。在本教程中,您将下载出租车下客和上客位置的数据集并使用 GeoAnalytics Tools 确定较频繁下客的位置。
先决条件
确保您的 ArcGIS Enterprise 管理员已配置 GeoAnalytics Server。您需要从管理员获取 ArcGIS Server Manager URL,才能访问 GeoAnalytics Server。了解有关 设置 ArcGIS GeoAnalytics Server 的详细信息。
准备数据
要下载和准备此示例中使用的数据,请按照下列步骤操作:
- 在 GeoAnalytics Server 可用的位置创建一个名为 BigDataExample 的文件夹。在文件夹 BigDataExample 中,创建一个名为 NYCTaxi 的文件夹。
- 访问 http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml 并将 2014 年 1 月和 2 月的黄色出租车数据下载到文件夹 BigDataExample > NYCTaxi。
创建大数据文件共享
将数据保存在所有 GeoAnalytics Server 计算机可访问的位置后,请通过 GeoAnalytics Server Manager 将其作为大数据文件共享注册到您的 GeoAnalytics Server。大数据文件共享还将创建大数据目录服务,可以在 GeoAnalytics Server 工具中使用。要创建大数据文件共享,请按照下列步骤操作:
- 登录 GeoAnalytics Server Manager。URL 格式为 https://gisserver.domain.com:6443/arcgis/manager。如果您不清楚此 URL,请向管理员请求该 URL。
- 点击站点 > 数据存储并选择注册大数据文件共享。
- 接受默认文件共享类型,输入唯一名称和文件夹路径 BigDataExample(例如,\\sharedLocation\BigDataExample),然后单击创建。这将创建一个大数据文件共享数据存储。这对应于门户中的大数据文件共享项,通过 https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer 格式的 URL 提供基础大数据目录服务,其中 FileShareName 由注册时对数据存储的命名决定。在本例中,大数据文件共享拥有一个以大数据文件共享中的文件夹命名的数据集 NYCTaxi。
编辑大数据文件共享
此数据集具有多个日期和时间字段。您需要检查清单中的数据集以确保您使用的是正确的字段。要在清单中编辑和查看数据集,请单击 Server Manager 中大数据文件共享旁边的“铅笔图标”。首次生成清单时,geometry 和 time 参数将确定上客位置。通过清单生成过程选择上客位置字段。对于本教程,您所感兴趣的是针对下客位置运行分析。
注:
生成清单后,系统将应用最佳猜测以查找用于表示几何和时间的字段。
在本教程中,您需要修改清单以使用放置时间和放置位置。这表示分析将聚合下客位置,而非上客位置。任何一组几何(上客或下客)均可用于分析。要使用的正确几何组取决于您要尝试解决的问题。通过使用大数据文件共享数据集编辑器进行这些更改。
注:
这也可以通过下载清单,编辑并上传编辑后的清单来完成。要了解有关编辑清单本身的详细信息,请参阅:了解大数据文件共享清单。
- 选择大数据文件共享旁边的“铅笔”按钮,以便在大数据文件共享清单生成后对其进行编辑。
- 在数据集下,选择 NYC 出租车数据集。
- 将鼠标悬停在几何图标旁边的信息图标上。当前几何由 X 轴 pickup_longitude 字段和 Y 轴 pickup_latitude 字段来决定。
- 在字段选择器中选择字段 pickup_longitude。该字段包含形式为 X 的几何。取消选择几何相关的属性按钮。
- 选择字段 dropoff_longitude。要将几何应用于此字段,请选中几何相关的属性按钮旁边的复选框。将格式指定为 X。
- 重复步骤 4 和 5,将 Y 的几何字段从 pickup_latitude 改为 dropoff_latitude。完成编辑后,单击保存并关闭大数据文件共享对话框。
通过 Portal for ArcGIS 对出租车数据进行分析
将数据注册到 GeoAnalytics Server 且在门户中创建了大数据文件共享项后,即可浏览到该项目并对其运行 GeoAnalytics 工具。
注:
注册到 GeoAnalytics Server 的数据并未上传到您的服务器,它只注册到 GeoAnalytics Server 并有一个清单来定义模式。
- 登录门户。URL 的格式为 https://webadaptorhost.domain.com/arcgis/home,其中 arcgis 是注册到门户网站的 Web adaptor 的名称。转至我的内容。在我的内容表中,您将看到刚刚创建的大数据文件共享项。
- 单击地图转至地图查看器。
- 单击分析按钮。如果要素和栅格分析均可用,请单击要素分析,然后单击 GeoAnalytics 工具 > 汇总数据 > 聚合点。
- 运行聚合点工具可以将点聚合为指定大小的多边形或条柱,以更好地了解数据。因为没有要聚合到的面数据集,所以在空间和时间中都将聚合到条柱。要将纽约市出租车数据集添加为要聚合的图层,请选择浏览图层作为第一个工具参数。在出现的对话框中,选择我的内容然后浏览到纽约市出租车数据集。选择图层然后单击添加图层。
- 聚合成 1 千米大小的正方形条柱。
- 由于数据是已启用时间的,因此您可以应用时间片。通过下载数据,可以知道有两个月的数据。在本教程中,检查每个月的第一周。为此,将时间间隔设置为1 周,时间步长设置为1 个月,并将参考时间设置为 1 月 1 日中午 12:00。
- 选择感兴趣的统计数据;一些示例是 总量 的平均值,或者行程距离的方差。
- 将空间参考设置为纽约本地投影。单击齿轮按钮访问分析设置。对于处理坐标系,选择按指定,然后选择地球以浏览 UTM Zone 18N。缩放到纽约市区域并运行分析。正在 GeoAnalytics Server 中的计算机上运行分析。完成分析后,会将结果添加到您的地图中。结果将为方形面,用于表示各个面中出租车下客位置的计数以及您计算的其他统计数据。