本教程将介绍设置数据以创建大数据文件共享的步骤。 大数据文件共享是在门户中创建的项目,可将可用位置的要素数据(表、点、折线和面)引用到 GeoAnalytics Server。 门户中的大数据文件共享项目可用于管理和浏览已注册数据,以便可以在数据集上运行 GeoAnalytics Tools。 创建大数据文件共享后,您将使用聚合点工具获取数据。 在本教程中,您将下载出租车下客和上客位置的数据集并使用 GeoAnalytics Tools 确定较频繁下客的位置。
先决条件
确保您的 ArcGIS Enterprise 管理员已配置 GeoAnalytics Server。 有关详细信息,请参阅设置 ArcGIS GeoAnalytics Server。
准备数据
要下载和准备此示例中使用的数据,请按照下列步骤操作:
- 在 GeoAnalytics Server 可用的位置创建一个名为 BigDataExample 的文件夹。 在 BigDataExample 文件夹中,创建一个名为 NYCTaxi 的文件夹。
- 访问 https://www1.nyc.gov/site/tlc/about/tlc-trip-record-data.page 并将 2014 年 1 月和 2 月的黄色出租车数据下载到文件夹 BigDataExample > NYCTaxi。
创建大数据文件共享
将数据保存在所有 GeoAnalytics Server 计算机可访问的位置后,请通过门户将其作为大数据文件共享注册到您的 GeoAnalytics Server。 大数据文件共享将创建大数据目录服务,可以在 GeoAnalytics Server 工具中使用。 要创建大数据文件共享,请按照下列步骤操作:
- 登录至 ArcGIS EnterpriseArcGIS Enterprise 门户。
URL 的格式为 https://webadaptorhost.domain.com/arcgis/home,其中 arcgis 是注册到门户网站的 Web adaptor 的名称。
- 浏览到内容 > 新建项目,然后选择数据存储。
- 在标题字段中输入大数据文件共享的名称。
- 选择大数据文件共享选项。 单击下一步以进入步骤 2:配置连接。
- 对于文件共享选择第一个选项,然后单击下一步。
- 在路径字段中,输入 BigDataExample 文件夹的文件路径。
例如,例如,对于 Microsoft Windows 上名为 sharedLocation 的目录中名为 BigDataExample 的文件夹,请输入 \\sharedLocation\BigDataExample。 对于 Linux 上相同的文件夹路径,请输入 /sharedLocation/BigDataExample。
- 单击下一步以进入步骤 3:配置服务器。
- 等待 GeoAnalytics Server 验证。
- 当状态列中显示绿色对号时,单击添加数据存储。
这将创建两个项目:一个大数据文件共享项目和一个数据存储项目。 大数据文件共享项目显示您的数据集,因此您可以查看和更新属性(例如模式、几何和时间)。 大数据文件共享项目对应于通过以下格式的 URL 提供的基础大数据目录服务。
https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer
在上述示例 URL 中,FileShareName 是您在向 GeoAnalytics Server 注册数据存储时指定的标题。
编辑大数据文件共享
在本教程中,大数据文件共享包含一个以大数据文件共享中的文件夹命名的数据集 NYCTaxi。
此数据集具有多个日期和时间字段。 检查数据集以确保使用的是正确的字段。 要编辑和查看大数据文件共享中的数据集,浏览至新的大数据文件共享门户内容项目,转到数据集页面并单击数据集旁边的编辑按钮。 创建大数据文件共享后,geometry 和 time 参数将设置为使用上客信息。 对于本教程,您所感兴趣的是针对下客位置运行分析。
注:
创建大数据文件共享后,系统将应用最佳猜测以查找用于表示几何和时间的字段。
在本教程中,您需要修改数据集属性以使用下客时间和下客位置。 这表示分析将聚合下客位置,而非上客位置。 任何一组几何(上客或下客)均可用于分析。 要使用的正确几何组取决于您要尝试解决的问题。 通过使用大数据文件共享数据集的编辑数据集属性对话框进行这些更改。
注:
这也可以通过下载清单,编辑并上传编辑后的清单来完成。 要了解有关编辑清单本身的详细信息,请参阅了解大数据文件共享清单。
- 在大数据文件共享项目页面中,浏览到数据集选项卡。
- 单击 NYCTaxi 数据集旁边的编辑按钮以编辑属性。
随即显示编辑数据集属性对话框。
- 几何选项卡显示当前用于表示 x 和 y 值的字段是 pickup_longitude 和 pickup_latitude。 更改值如下:
- 将 X 字段值从 pickup_longitude 更改为 dropoff_longitude。
- 将 Y 字段值从 pickup_latitude 更改为 dropoff_latitude。
- 时间选项卡显示当前用于表示时间值的字段为 pickup_datetime,格式为 yyyy-MM-dd HH:mm:ss。 将时间字段设置从 pickup_datetime 更改为 dropoff_datetime。
- 单击保存按钮以保存对大数据文件共享数据集的更改。
在 ArcGIS Enterprise 门户中对出租车数据进行分析
创建数据和大数据文件共享项目后,浏览至门户组织中的大数据文件共享项目以访问您的数据集。 您可以使用这些数据集运行 GeoAnalytics Server 工具。
注:
注册到 GeoAnalytics Server 的数据并未上传到您的服务器,它只注册到 GeoAnalytics Server 并使用一个清单来定义模式。
- 在门户中,单击地图以转到 Map Viewer 经典版。
- 单击分析按钮。
如果要素和栅格分析均可用,请单击要素分析,然后单击 GeoAnalytics 工具 > 汇总数据 > 聚合点。
- 在查找地址或地点搜索栏中输入 New York,然后单击搜索。
您的地图随即缩放至纽约市范围。
- 要将纽约市出租车数据集添加为要聚合的图层,请选择选择分析图层作为第一个工具参数。 在显示的对话框上,选择内容并浏览至大数据文件共享。 选择 New York City taxi cab 图层并单击选择。
- 聚合成 1 千米大小的正方形图格。
- 由于数据是已启用时间的,因此您可以应用时间步长。 通过下载数据,可以知道有两个月的数据。 在本教程中,检查每个月的第一周。 为此,请将时间步长间隔设置为 1 周,将重复时间步长的频率设置为 1 个月并将用于对齐时间步长的时间设置为 2017 年 1 月 1 日 12:00 am。虽然是 2014 年的测试数据,但是聚合点允许您按照时间前后对齐分析。
- 选择感兴趣的统计数据;一些示例是 total_amount 的平均值,或者行程距离的方差。
- 使用以下步骤将空间参考设置为纽约本地投影:
- 单击设置按钮以访问分析设置。
- 从处理坐标系下拉列表中选择按指定。
- 通过单击空间参考 > PCS > UTM > WGS 1984 UTM Zone 18 N,单击地球并浏览至 UTM Zone 18N
- 单击确定,然后单击应用。
- 缩放至纽约市区域,确保在聚合点工具上选中使用当前地图范围并运行分析。
分析在 GeoAnalytics Server 中的计算机上运行。 完成分析后,会将结果添加到您的地图中。 结果将为方形面,用于表示各个面中出租车下客位置的计数以及您计算的其他统计数据。 您的结果将包含约 3500 至 4000 个要素。 结果将会有所不同,具体取决于屏幕上的地图范围和时区。