大数据文件共享通过 ArcGIS Server Manager 注册为数据存储,并且需要一个清单来概述数据的方案以及表示数据集中的几何和时间的字段。注册大数据文件共享时,会自动生成该清单。如果数据发生任何更改或如果清单生成无法确定所需的所有信息(例如,如果自动生成的清单没有为几何或时间选择正确的字段),则可能需要进行修改。
可通过 ArcGIS Server Manager 查看和编辑数据集与清单信息。清单查看器由以下三个组件组成:
- 数据集选择器
- 有关所选数据集的信息
- 有关选定数据集中的字段的信息
大数据文件共享清单编辑器中也存在高级选项。将在下面的高级部分中介绍这些高级选项。如果清单生成未正确确定字段名、编码、字段分隔符或引号字符,则建议在编辑数据前使用提示文件。
数据集选择器
清单由一个或多个数据集组成。数据集数量取决于大数据文件共享位置中的文件夹数量。打开清单管理器后,可以看到已成功注册到大数据文件共享中的数据集。从下拉菜单中选择数据集后,数据集参数将使用数据集信息进行填充。
如果您希望在清单中找到更多数据集或者丢失任何数据集,请执行以下操作:
- 确认是否正确注册顶级文件夹。有关详细信息,请参阅通过 ArcGIS Server Manager 注册数据存储。
- 检查输入数据是否采用允许的格式,例如分隔文件或 shapefile 集合。
- 对于文件集合,确保感兴趣的输入数据集的方案一致(单个文件夹中的所有文件必须具有相同的字段)。
数据集
数据集字段用于说明所选数据集的格式。根据数据集的源(通过文件扩展名表示),可更改的选项将有所不同。文件扩展名可以是 shapefile (.shp) 或分隔文件(例如 .csv 或 .tsv)。如果数据集的输入文件为 shapefile,则以下选项可用:
参数 | 描述 |
---|---|
文件扩展名 | 列出输入数据集上的文件类型扩展名。对于 shapefile,该扩展名将始终为 shp 且无法修改。 |
几何 | 用于确定 shapefile 的几何类型。对于 shapefile 数据集,无法修改此项。 |
空间参考 (WKID/WKT) | 用于确定 shapefile 的空间参考。对于 shapefile 数据集,无法修改此项。 |
时间 | 输入 shapefile 数据集的时间类型。选项如下:
|
时区 | 用于表示时间字段的时区。如果时间类型为 Instant 或 Interval,则可以指定时区。 |
如果输入数据集为分隔文件,则可在 Manager 中修改清单中的多个参数。下表概述了这些参数:
参数 | 描述 |
---|---|
文件扩展名 | 列出输入数据集上的文件类型扩展名。常用格式为 .csv 和 .txt。此信息可以包含在提示文件中。 |
字段分隔符 | 确定每个字段的分隔符。常用格式为 , 和 ;。此信息可以包含在提示文件中。 |
记录结束符 | 确定每行数据的结束符。常用格式为 \n 和 \t。此信息可以包含在提示文件中。 |
具有标题行 | 确定输入表是否包含标题行的布尔值。如果包含标题行,则标题将用于字段名。字段名信息用于预测几何和时间字段。可使用提示文件设置标题。 |
几何 | 用于确定输入数据集的几何类型。选项如下:
可以修改几何类型,表示几何的字段和格式在字段部分中设置。 |
空间参考 (WKID/WKT) | 用于确定数据集的空间参考。可将此项修改为 WKID 或 WKT 字符串。 |
时间 | 输入数据集的时间类型。选项如下:
|
时区 | 用于表示时间字段的时区。如果时间类型为 Instant 或 Interval,则可以指定时区。 |
字段
字段部分列出了数据集中的所有字段。选择字段后,将能够看见以下内容:
- 字段的名称。
- 字段类型。
- 如果字段包含任何时间或几何相关属性。如果字段包含这些属性,则可以定义格式。
参数 | 描述 |
---|---|
名称 | 字段的名称。可为分隔文件修改此项。建议使用提示文件为不含标题名称的分隔数据集修改此项。无法修改 shapefile 的字段名称。 |
类型 | 字段的类型。可为分隔文件修改此项。无法修改 shapefile 的字段类型。 |
几何相关属性 | 指示该字段是否包含几何信息的布尔值。此项仅适用于已指定几何的分隔文件。如果选定此项,则将出现一个可用于设置几何格式的额外参数。 |
格式(几何) | 几何字段的格式。 |
时间相关属性 | 指示该字段是否包含时间信息的布尔值。此项仅适用于已指定时间的分隔文件。如果选定此项,则将出现一个可用于设置时间格式的额外参数。 |
格式(时间) | 时间字段的格式。下面介绍了时间格式。 |
角色 | 间隔要求在时间上设置角色。角色可以为 Start 或 End。此选项不适用于时刻。 |
时间格式
下表概述了通过 ArcGIS Server Manager 或直接在清单中编辑大数据文件共享时如何表示时间。这些示例显示如何表示时间 2016 年 1 月 2 日下午 9:45:02.05。
符号 | 含义 | 示例 |
---|---|---|
yy | 年,以两位数表示。 | 16 |
yyyy | 年,以四位数表示。 | 2016 |
MM | 月,以数字表示。 | 01 或 1 |
MMM | 月,使用三个字母表示。 | Jan |
MMMM | 月,使用完整的拼写表示。 | January |
dd | 天。 | 02 或 2 |
HH | 小时,值介于 0-23 之间(采用 24 小时制)。 | 21 |
hh | 小时,值介于 1-12 之间(采用 12 小时制)。 | 9 |
mm | 分钟,值范围为 0-59。 | 45 |
ss | 秒,值范围为 0-59。 | 02 |
SSS | 毫秒,值范围为 0-999。 | 50 |
a | AM/PM 标记。 | PM |
下表概述了同一日期的不同格式示例:2016 年 1 月 2 日下午 9:45:02.05:
输入日期 | 日期格式 |
---|---|
01/02/2016 9:45:02PM | MM/dd/yyyy hh:mm:ssa |
Jan02-16 21:45:02 | MMMdd-yy HH:mm:ss |
January 02 2016 9:45:02.050PM | MMMM dd yyyy hh:mm:ss.SSSa |
高级版
下面两个高级选项在大数据文件共享编辑器中可用:
- 清单 - 下载和上传大数据文件共享清单。
- 提示 - 下载和上传用于帮助生成大数据文件共享清单的提示文件。
提示允许您使用分隔的文件参数(例如字段名称、编码、字段分隔符和引号字符)为生成清单提供帮助。建议在以下情况下上传提示文件后编辑各个数据集:
- 您拥有一个不含标题的 CSV 且想要将字段名应用于数据。
- 首次生成清单时无法识别引号和分隔符。
- 无法识别数据集的编码。
如果您要上传提示文件,则需要重新生成清单。将仅更新已提供提示的数据集或新数据集,对提示文件中不含的任何其他数据集做出的更改将保持不变。有关提示文件的详细信息,请参阅了解提示文件。还可以下载清单并在文本编辑器中进行更改。如果您上传文件清单,它将会覆盖您在编辑器中对大数据文件共享清单所做的任何更改并替换当前清单。有关大数据文件共享清单的详细信息,请参阅了解大数据文件共享清单。
编辑大数据文件共享
注册大数据文件共享之后,您可以通过打开大数据文件共享清单编辑器来查看并编辑该项目的已注册数据集的属性和设置。
例如,您可能想要验证已注册文件共享中数据集的数量。在此过程中,如果您没有在已注册文件共享中看到预期数量的数据集,则应检查注册的位置是否包含有效数据集。
您可能还想查看已注册大数据共享文件的数据集方案。您可以通过更新相关清单资源中的几何、时间定义和字段名称来修改选定的数据集方案。
在大数据文件共享清单编辑器的高级选项卡上,您可以上传提示文件以提供有关数据集的信息,例如是否存在标题行、编码、字段分隔符或记录终止符。上传提示文件后重新生成清单时,将使用所提供的信息来生成该清单。
此外,您还可以下载该清单、进行编辑,然后上传编辑后的清单文件。
编辑大数据文件共享数据集
在大数据文件共享清单编辑器中,您可以查看所选的大数据文件共享以及成功注册到其中的数据集。从编辑器下拉菜单中选择数据集时,还会填充相应参数。有关该对话框中每个选项的详细信息,请参阅关于大数据文件共享清单。要编辑数据集参数,请执行以下操作:
- 在已注册的数据存储对话框上,找到您想要编辑的大数据文件共享。
- 单击编辑铅笔以显示对应数据集的详细信息和选项。
- 单击数据集选项卡以显示已注册数据集及其对应参数。
- 从下拉菜单中选择数据集以查看其清单中显示的信息。将鼠标悬停在几何和时间属性旁边的信息图标上可查看所选数据集的详细设置。可根据需要对数据集属性进行更新。
下一部分包含编辑已注册大数据文件共享数据集详细设置的示例。
- 编辑完数据集属性后,单击保存。
编辑大数据文件共享数据集的示例工作流
在大数据文件共享清单编辑器中可以执行以下示例工作流。
- 更新 .csv 数据集的几何类型和字段设置。
- 在已注册的数据存储对话框上,找到您想要编辑的大数据文件共享。
- 单击编辑铅笔以显示对应数据集的详细信息和选项。
- 在数据集选项卡上,从下拉菜单中选择一个数据集。
- 将鼠标悬停在几何信息图标上可查看属性的详细描述。
- 通过选择字段部分中的每个字段并禁用该字段包含:几何相关属性复选框来移除所有现有的几何字段。单击保存。
- 单击几何类型下拉按钮并选择所需类型。
- 将几何的空间参考指定为熟知 ID (WKID) 或熟知文本 (WKT)。有关受支持的 WKID 和 WKT 条目的列表,请参阅 ArcGIS REST API 文档中的空间参考主题。
- 在字段部分,选择所需字段,然后启用该字段包含:几何相关属性复选框并指定格式(指示字段是表示 POINT 几何的 X 或 Y 值还是自定义几何定义)。
- 根据需要针对其他字段重复上述步骤。
- 单击保存。
- 更新 shapefile 文件数据集的时间参考。
- 在已注册的数据存储对话框上,找到您想要编辑的大数据文件共享。
- 单击编辑铅笔以显示对应数据集的详细信息和选项。
- 在数据集选项卡上,从下拉菜单中选择一个数据集。
- 将鼠标悬停在时间信息图标上可查看属性的详细描述。
- 通过选择字段部分中的每个字段并禁用该字段包含:时间相关属性复选框来移除所有现有的时间字段。单击保存。
- 单击时间下拉按钮并选择所需类型(时刻或间隔)。
- 指定数据集的时区。默认值为 UTC。应将时区值指定为此处所示 TZ 列中的值。
- 在字段部分,选择所需时间字段,然后启用该字段包含:时间相关属性复选框,并指定时间格式和角色(如果适用)。
- 根据需要针对其他字段重复上述步骤。
- 单击保存。
- 更改 .csv 数据集的字段名称或字段类型。
- 在已注册的数据存储对话框上,找到您想要编辑的大数据文件共享。
- 单击编辑铅笔以显示对应数据集的详细信息和选项。
- 在数据集选项卡上,从下拉菜单中选择一个数据集。
- 在字段部分,使用下拉菜单选择所需字段。
- 选择所需字段后,在名称对话框上输入新字段名称和/或使用下拉菜单来选择不同的类型。
- 单击保存。
提示:
对于高级工作流,例如指定不同字段分隔符、记录终止符或修改多个字段名称,请上传带有所需规则的新提示文件并重新生成清单。
编辑大数据文件共享清单或提示文件
在大数据文件共享编辑器的高级选项卡上,您可以通过选择相应的选项卡来编辑相关清单或提示文件。如果您上传文件清单,它将会覆盖您在编辑器中对大数据文件共享清单所做的任何更改并替换当前清单。有关详细信息,请参阅了解大数据文件共享清单。要编辑大数据文件共享清单或提示文件,请执行以下操作:
- 在已注册的数据存储对话框上,找到您想要修改的大数据文件共享。
- 单击编辑铅笔以显示用于修改清单资源的选项。
- 单击高级选项卡。
- 根据您所要进行的修改,从高级选项卡上,选择清单或提示选项卡。
- 要下载清单文件,请单击清单 > 下载。
- 要下载提示文件,请单击提示 > 下载。
- 使用文件编辑器可本地修改下载的 .json 清单文件或 .dat 提示文件并保存对它们进行的更改。
提示:
提示文件的默认文件格式为 .dat。下载文件后,您可以将其扩展名改为 .txt 并编辑该文件。 - 要上传编辑后的文件,请单击您要修改的大数据文件共享的编辑铅笔。
- 要编辑清单,请单击高级 > 清单 > 上传并浏览至更新的 .json 文件。
- 要编辑提示文件,请单击高级 > 提示 > 上传并浏览至更新的 .txt 文件。
- 单击上传。
如果您上传例如提示文件,请确保重新生成清单。
重新生成大数据文件共享的清单
创建大数据文件共享并生成清单之后,将在已注册数据存储对话框上针对每个条目显示重新生成清单按钮。
如果您添加了新数据或使用编辑资源上传了提示文件,您可以重新生成清单。提示文件提供有重新生成清单所用的规范。