本教程将介绍设置数据以创建大数据文件共享的步骤。大数据文件共享是在门户中创建的项目,可将可用位置的要素数据(表、点、折线和面)引用到 GeoAnalytics Server。利用门户中的大数据文件共享项目可以浏览已注册的数据,以便您在数据集上运行 GeoAnalytics 工具。创建了大数据文件共享后,您将使用聚合点工具获取数据。在本教程中,您将下载出租车下客和上客位置的数据集并使用 GeoAnalytics 工具 确定较频繁下客的位置。
先决条件
确保您的 ArcGIS Enterprise 管理员已配置 GeoAnalytics Server。您需要从管理员处获取 ArcGIS Server Manager URL,才能访问 GeoAnalytics Server。了解有关设置 ArcGIS GeoAnalytics Server 的详细信息。
准备数据
要下载和准备此示例中使用的数据,请按照下列步骤操作:
- 在 GeoAnalytics Server 可用的位置创建一个名为 BigDataExample 的文件夹。在文件夹 BigDataExample 中,创建一个名为 NYCTaxi 的文件夹。
- 访问 http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml 并将 2014 年 1 月和 2 月的黄色出租车数据下载到文件夹 BigDataExample > NYCTaxi。
创建大数据文件共享
将数据保存在所有 GeoAnalytics Server 计算机可访问的位置后,请通过 GeoAnalytics Server Manager 将其作为大数据文件共享注册到您的 GeoAnalytics Server。大数据文件共享将创建大数据目录服务,可以在 GeoAnalytics Server 工具中使用。要创建大数据文件共享,请按照下列步骤操作:
- 登录 GeoAnalytics Server Manager。URL 格式为 https://gisserver.domain.com:6443/arcgis/manager。如果您不清楚此 URL,请向管理员请求该 URL。
- 点击站点 > 数据存储并选择注册大数据文件共享。
- 接受默认文件共享类型,输入唯一名称和文件夹路径 BigDataExample(例如,适用于 Windows 的 \\sharedLocation\BigDataExample 或适用于 Linux 的/sharedLocation/BigDataExample),然后单击创建。这将创建一个大数据文件共享数据存储。这对应于门户中的大数据文件共享项,通过 https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer 格式的 URL 提供基础大数据目录服务,其中 FileShareName 由注册时对数据存储的命名决定。在本例中,大数据文件共享拥有一个以大数据文件共享中的文件夹命名的数据集 NYCTaxi。
编辑大数据文件共享
此数据集具有多个日期和时间字段。您需要检查清单中的数据集以确保您使用的是正确的字段。要在清单中编辑和查看数据集,请单击 Server Manager 中大数据文件共享旁边的“铅笔图标”。首次生成清单时,geometry 和 time 参数将使用上客位置。通过清单生成过程选择上客位置字段。对于本教程,您所感兴趣的是针对下客位置运行分析。
注:
生成清单后,系统将应用最佳猜测以查找用于表示几何和时间的字段。
在本教程中,您需要修改清单以使用放置时间和放置位置。这表示分析将聚合下客位置,而非上客位置。任何一组几何(上客或下客)均可用于分析。要使用的正确几何组取决于您要尝试解决的问题。通过使用大数据文件共享数据集编辑器进行这些更改。
注:
这也可以通过下载清单,编辑并上传编辑后的清单来完成。要了解有关编辑清单本身的详细信息,请参阅:了解大数据文件共享清单。
- 选择大数据文件共享旁边的“铅笔”按钮,以便在大数据文件共享清单生成后对其进行编辑。
- 在数据集下,选择 NYCTaxi 数据集。
- 几何部分显示当前用于表示 X 和 Y 值的字段是 pickup_longitude 和 pickup_latitude。将用于表示 X 值的字段的值从 pickup_longitude 更改为 dropoff_longitude。将用于表示 Y 值的字段的值从 pickup_latitude 更改为 dropoff_latitude。
- 时间部分显示当前用于表示时间值的字段为 tpep_pickup_datetime,格式为 yyyy-MM-dd HH:mm:ss。将时间字段从 tpep_pickup_datetime 更改为 tpep_dropoff_datetime。
- 单击保存按钮以保存大数据文件共享的更改。
通过 Portal for ArcGIS 对出租车数据进行分析
将数据注册到 GeoAnalytics Server 且在门户中创建了大数据文件共享项后,即可浏览到该项目并对其运行 GeoAnalytics Server 工具。
注:
注册到 GeoAnalytics Server 的数据并未上传到您的服务器,它只注册到 GeoAnalytics Server 并使用一个清单来定义模式。
- 登录门户。URL 的格式为 https://webadaptorhost.domain.com/arcgis/home,其中 arcgis 是注册到门户网站的 Web adaptor 的名称。转至内容。在内容表中,您将看到刚刚创建的大数据文件共享项目。
- 单击地图转至 Map Viewer。
- 单击分析按钮。如果要素和栅格分析均可用,请单击要素分析,然后单击 GeoAnalytics 工具 > 汇总数据 > 聚合点。
- 运行聚合点工具可以将点聚合为指定大小的多边形或条柱,以更好地了解数据。因为没有要聚合到的面数据集,所以在空间和时间中都将聚合到条柱。要将纽约市出租车数据集添加为要聚合的图层,请选择浏览图层作为第一个工具参数。在出现的对话框中,选择内容然后浏览到纽约市出租车数据集。选择图层然后单击添加图层。
- 聚合成 1 千米大小的正方形条柱。
- 由于数据是已启用时间的,因此您可以应用时间步长。通过下载数据,可以知道有两个月的数据。在本教程中,检查每个月的第一周。为此,请将时间步长间隔设置为 1 周,将重复时间步长的频率设置为 1 个月并将用于对齐时间步长的时间设置为 2017 1 月 1 日 12:00 am。
- 选择感兴趣的统计数据;一些示例是 total_amount 的平均值,或者行程距离的方差。
- 将空间参考设置为纽约本地投影。单击齿轮按钮访问分析设置。为处理坐标系选择按指定,然后单击空间参考 > PCS > UTM WGS 1984 UTM Zone 18 N 选择地球以浏览 UTM Zone 18N,然后选中确定和应用。缩放至纽约市区域,确保选中使用当前地图范围并运行分析。正在 GeoAnalytics Server 中的计算机上运行分析。完成分析后,会将结果添加到您的地图中。结果将为方形面,用于表示各个面中出租车下客位置的计数以及您计算的其他统计数据。