Big-Data-Dateifreigaben werden über ArcGIS Server Manager als Data Store in ArcGIS GeoAnalytics Server registriert. Eine Big-Data-Dateifreigabe erfordert ein Manifest, um das Schema der Daten sowie die Felder und Formate zur Darstellung von Geometrie und Zeit in einem Dataset zu beschreiben. Das Manifest wird beim Registrieren einer Big-Data-Dateifreigabe automatisch erstellt. Sie müssen möglicherweise Änderungen vornehmen, wenn sich Ihre Daten ändern oder wenn anhand der Manifesterstellung nicht alle erforderlichen Informationen ermittelt werden konnten (das automatisch erstellte Manifest hat beispielsweise nicht das richtige Feld für die Geometrie oder Zeit ausgewählt).
Sie können die Datasets und Manifestinformationen über ArcGIS Server Manager in ArcGIS GeoAnalytics Server anzeigen und bearbeiten.
Bearbeiten einer Big-Data-Dateifreigabe
Nachdem Sie eine Big-Data-Dateifreigabe registriert haben, können Sie Attribute und Einstellungen für die registrierten Datasets dieses Elements anzeigen und bearbeiten, indem Sie den Editor für Manifeste zur Big-Data-Dateifreigabe öffnen.
Sie können beispielsweise die Anzahl der Datasets in einer registrierten Dateifreigabe überprüfen. Wenn dabei die erwartete Anzahl der Datasets in der registrierten Dateifreigabe nicht angezeigt wird, sollten Sie überprüfen, ob der registrierte Speicherort gültige Datasets enthält.
Sie können außerdem Dataset-Schemas für eine registrierte Big-Data-Dateifreigabe überprüfen. Sie können das Schema eines ausgewählten Datasets ändern, indem Sie dessen Geometrie, Zeitdefinition und Feldnamen in der zugehörigen Manifest-Ressource aktualisieren.
Auf der Registerkarte des Editors für Manifeste zur Big-Data-Dateifreigabe können Sie eine Hint-Datei hochladen, um Informationen zu einem Dataset, z. B. das Vorhandensein oder Fehlen einer Kopfzeile, Codierung, Feldtrennzeichen oder Datensatztrennzeichen, bereitzustellen. Wenn das Manifest nach dem Hochladen einer Hint-Datei neu erstellt wird, wird das Manifest anhand der bereitgestellten Informationen erzeugt.
Sie können das Manifest auch herunterladen, bearbeiten und die editierte Manifest-Datei hochladen.
Bearbeiten der Datasets einer Big-Data-Dateifreigabe
Im Editor für Manifeste zur Big-Data-Dateifreigabe können Sie eine ausgewählte Big-Data-Dateifreigabe und die Datasets anzeigen, die erfolgreich darin registriert wurden. Bei Auswahl eines Datasets aus dem Dropdown-Menü des Editors werden die entsprechenden Parameter ausgefüllt. Weitere Informationen zu den einzelnen Optionen in diesem Dialogfeld finden Sie unter Bearbeiten von Manifesten zur Big-Data-Dateifreigabe in Manager. Führen Sie zum Bearbeiten von Dataset-Parametern die folgenden Schritte aus:
- Suchen Sie im Dialogfeld Registrierte Data Stores die Big-Data-Dateifreigabe, die Sie bearbeiten möchten.
- Klicken Sie auf das Stiftsymbol Bearbeiten, um die Details und Optionen für entsprechende Datasets anzuzeigen.
- Klicken Sie auf die Registerkarte Datasets, um die registrierten Datasets und die entsprechenden Parameter anzuzeigen.
- Wählen Sie ein Dataset aus dem Dropdown-Menü aus, um die in dessen Manifest dargestellten Informationen anzuzeigen. Aktualisieren Sie bei Bedarf die Dataset-Eigenschaften.
- Wenn Sie die Bearbeitung der Dataset-Eigenschaften abgeschlossen haben, klicken Sie auf Speichern.
Bearbeiten eines Manifests zur Big-Data-Dateifreigabe oder einer Hint-Datei
Auf der Registerkarte Erweitert des Editors für die Big-Data-Dateifreigabe können Sie das zugehörige Manifest oder die Hint-Datei bearbeiten, indem Sie die jeweilige Registerkarte auswählen. Wenn Sie ein Manifest hochladen, überschreibt es alle Änderungen, die Sie an Ihrem Big-Data-Dateifreigabemanifest im Editor vorgenommen haben, und ersetzt das aktuelle Manifest. Weitere Informationen zu Big-Data-Dateifreigabemanifesten finden Sie unter Manifest zur Big-Data-Dateifreigabe. Weitere Informationen zur Verwendung einer Hint-Datei finden Sie unter Hint-Dateien. Um ein Manifest zur Big-Data-Dateifreigabe oder eine Hint-Datei zu bearbeiten, führen Sie die folgenden Schritte aus:
- Suchen Sie im Dialogfeld Registrierte Data Stores die Big-Data-Dateifreigabe, die Sie ändern möchten.
- Klicken Sie auf das Stiftsymbol Bearbeiten, um Optionen zum Ändern der Manifest-Ressource anzuzeigen.
- Klicken Sie auf die Registerkarte Erweitert.
- Wählen Sie auf der Registerkarte Erweitert die Registerkarte Manifest oder Hints aus, je nachdem, welche Sie bearbeiten möchten.
- Um die Manifestdatei herunterzuladen, klicken Sie auf Manifest > Herunterladen.
- Um die Hint-Datei herunterzuladen, klicken Sie auf Hints > Herunterladen.
- Verwenden Sie einen Texteditor, um die heruntergeladene.json Manifest- oder .dat Hint-Datei zu ändern und lokal zu speichern.
Tipp:
Das Standarddateiformat für die Hint-Datei ist .dat. Nachdem Sie die Datei heruntergeladen haben, können Sie deren Erweiterung in .txt ändern und die Datei bearbeiten. - Um eine geänderte Datei hochzuladen, klicken Sie für die Big-Data-Dateifreigabe, die Sie ändern möchten, auf das Stiftsymbol Bearbeiten.
- Um das Manifest zu bearbeiten, klicken Sie auf Erweitert > Manifest > Hochladen, und navigieren Sie zu der aktualisierten .json-Datei.
- Um die Hint-Datei zu bearbeiten, klicken Sie auf Erweitert > Hints > Hochladen, und navigieren Sie zu der aktualisierten .txt-Datei.
- Klicken Sie auf Hochladen.
Wenn Sie eine Hint-Datei hochladen, müssen Sie sicherstellen, dass das Manifest neu generiert wird. Beim Generieren eines Manifests werden nur Datasets mit Hints bzw. neue Datasets aktualisiert. Nicht in der Hint-Datei enthaltene Datasets werden nicht geändert.
Neugenerieren des Manifests für eine Das Big-Data-Dateifreigabe
Nachdem eine Big-Data-Dateifreigabe erstellt und ein Manifest generiert wurde, wird die Schaltfläche "Manifest neu generieren" für jeden Eintrag im Dialogfeld Registrierte Data Stores angezeigt.
Sie können ein Manifest neu generieren, wenn Sie neue Daten hinzugefügt oder eine Hint-Datei mit der Bearbeitungsressource hochgeladen haben. Die Hint-Datei enthält Spezifikationen, die beim erneuten Generieren des Manifests verwendet werden.
Hinweis:
Wenn ein Manifest neu generiert wird, aktualisiert es das Manifest für vorhandene Datasets, die über eine Hint-Datei oder neue Datasets verfügen. Alle am Manifest vorgenommenen Änderungen werden mit den in der Hint-Datei definierten Regeln überschrieben.Bearbeitungsparameter für Big-Data-Dateifreigaben
Der Editor für Big-Data-Dateifreigaben besteht aus den folgenden fünf Abschnitten:
- Dataset-Auswahl
- Felder
- Geometrie
- Zeit
- Dataset-Format
Es wird empfohlen, eine Hint-Datei für die Bearbeitung der Daten zu verwenden, falls bei der Manifesterstellung Feldnamen, Encodierung, Feldtrennzeichen oder Anführungszeichen nicht richtig ermittelt wurden.
Dataset-Auswahl
Ein Manifest umfasst mindestens ein Dataset. Die Anzahl der Datasets ist von der Anzahl der Ordner am Speicherort der Big-Data-Dateifreigabe abhängig. Nach dem Öffnen des Manifest-Managers können Sie die Datasets anzeigen, die in Ihrer Big-Data-Dateifreigabe erfolgreich registriert wurden. Wenn Sie ein Dataset im Dropdown-Menü auswählen, werden die Dataset-Informationen zum Ausfüllen der Dataset-Parameter verwendet.
Wenn Sie im Manifest weniger Datasets vorfinden als angenommen bzw. wenn Datasets fehlen, gehen Sie wie folgt vor:
- Überprüfen Sie, ob der Ordner der obersten Ebene ordnungsgemäß registriert wurde. Weitere Informationen erhalten Sie unter Registrieren von Data Stores über ArcGIS Server Manager.
- Überprüfen Sie, ob die Eingabedaten in einem zulässigen Format vorliegen, z. B. als Sammlung von durch Trennzeichen getrennten Dateien, Shapefiles, Parquet- oder ORC-Dateien.
- Stellen Sie sicher, dass das Schema des gewünschten Eingabe-Datasets in einer Sammlung von Dateien konsistent ist (alle Dateien in demselben Dataset müssen die gleichen Felder aufweisen).
Felder
Im Abschnitt zu Feldern werden alle Felder in einem Dataset aufgeführt. Wenn Sie ein Dataset auswählen, wird für jedes Feld Folgendes angezeigt:
- Der Name des Feldes.
- Den Feldtyp.
Für durch Trennzeichen getrennte Dateien können der Feldname und -typ geändert werden. Wenn Sie mehrere Feldnamen ändern, sollten Sie eine Hint-Datei verwenden.
Ist das Eingabe-Dataset eine durch Trennzeichen getrennte Datei, können mehrere Parameter im Manifest im Manager geändert werden.
Geometrie
Im Abschnitt "Geometrie" werden der Typ der Geometrie und seine Darstellung angegeben. In der folgenden Tabelle werden die verfügbaren Optionen veranschaulicht. Sie enthält außerdem Hinweise zu Änderungen, die Sie abhängig vom Eingabe-Dataset-Typ vornehmen können:
Geometrieparameter
Parameter | Beschreibung | Durch Trennzeichen getrennte Dateien | Shapefiles | ORC-Dateien | Parquet-Dateien |
---|---|---|---|---|---|
Geometrie | Der Geometrietyp: Die Optionen lauten "Punkt", "Polylinie", "Polygon" und "Keine". Wenn keine Geometrie vorhanden ist, ist die Eingabe eine Tabelle. | Editierbar | Kann nicht geändert werden | Editierbar | Editierbar |
Raumbezug (WKID/WKT) | Der Raumbezug des Datasets. Diese Option wird nur angezeigt, wenn das Dataset keine Tabelle ist. | Dieser Wert kann geändert werden. Standardmäßig ist er auf 4326, WGS 1984 festgelegt. | Dieser Wert kann nicht geändert werden. | Editierbar | Editierbar |
Geometrieformatierungstyp | Gibt an, wie die Geometrie für jedes Feature formatiert ist. Die Optionen lauten "XYZ" (Felder, die X-, Y- und optional Z-Werte darstellen – "XYZ" kann nur auf Punkte angewendet werden), "WKT" (Well-Known Text), "GeoJSON", "EsriJson" und "Shape". Diese Option ist nur verfügbar, wenn das Dataset keine Tabelle und kein Shapefile ist. | Editierbar | Nicht verfügbar | Editierbar | Editierbar |
Zeit
Im Abschnitt "Zeit" wird angegeben, wie die Zeit dargestellt wird. In der folgenden Tabelle werden die verfügbaren Optionen veranschaulicht. Sie enthält außerdem Hinweise zu Änderungen, die Sie abhängig vom Eingabe-Dataset-Typ vornehmen können. Zeitoptionen sind für alle Datentypen identisch, sofern nicht anders angegeben.
Zeitparameter
Parameter | Beschreibung | Beispiel |
---|---|---|
Zeittyp | Der Typ der Eingabezeit. Die Optionen sind Zeitpunkt (eine bestimmte Zeitangabe), Intervall (eine Zeitspanne mit Start- und Endzeit) und Keine. | Zeitpunkt |
Zeitzone | Die Zeitzone der Eingabezeit. Diese Option ist nur verfügbar, wenn Zeittyp auf Keine festgelegt ist. | UTC |
Namens- und Formatierungstabelle für die Zeit | In dieser Tabelle werden ein oder mehrere Zeitfelder ausgewählt, und in ihr wird beschrieben, wie die Zeit definiert ist. Im Abschnitt "Zeit" kann die Zeit mit einem oder mehreren Feldern definiert werden, und für ein einzelnes Feld können ein oder mehrere Formate verwendet werden. Standardmäßig wird das erste Feld mit dem Namen "Zeit" als Zeitfeld verwendet, und das Zeitformat wird geschätzt. Wenn ein Shapefile vorhanden ist, wird das erste Feld vom Typ "Datum" verwendet. Wenn die Zeit vom Typ Intervall ist, müssen eine Start- und eine Endzeit angegeben werden. Die Zeitformatierungstabelle ist nur verfügbar wenn der Zeittyp nicht Keine lautet. | Beispiel, in dem die Zeit in einem einzelnen Feld mit zwei verschiedenen Formaten dargestellt wird:
Beispiel, in dem die Zeit mit zwei Feldern dargestellt wird:
|
Uhrzeitformate
In der folgenden Tabelle wird veranschaulicht, wie Sie die Zeit darstellen, wenn Sie eine Big-Data-Dateifreigabe über ArcGIS Server Manager oder direkt in einem Manifest bearbeiten. Das Beispiel zeigt, wie der 2. Januar 2016, um 21:45:02.05 Uhr dargestellt wird.
Zeitformate in Big-Data-Dateifreigaben
Symbol | Bedeutung | Beispiel |
---|---|---|
yy | Das Jahr – durch zwei Ziffern dargestellt. | 16 |
yyyy | Das Jahr – durch vier Ziffern dargestellt. | 2016 |
MM | Der Monat – als numerischer Wert dargestellt. | 01 oder 1 |
MMM | Der Monat – durch drei Buchstaben dargestellt. | Jan |
MMMM | Der Monat – vollständig ausgeschrieben. | January |
dd | Der Tag. | 02 oder 2 |
HH | Die Stunde – wobei das 24-Stunden-Format mit Werten von 0 bis 23 verwendet wird. | 21 |
hh | Die Stunde – wobei das 12-Stunden-Format mit Werten von 1 bis 12 verwendet wird. | 9 |
mm | Die Minute – Werte liegen zwischen 0 und 59. | 45 |
ss | Die Sekunde – Werte liegen zwischen 0 und 59. | 02 |
SSS | Die Millisekunde – Werte liegen zwischen 0 und 999. | 50 |
a | Der AM/PM-Marker. | PM |
epoch_millis | Die Zeit in Millisekunden von der Unixzeit. | 1509581781000 |
epoch_seconds | Die Zeit in Sekunden von der Unixzeit. | 1509747601 |
Z | Der Zeitzonenversatz, ausgedrückt in Stunden. | -0100 oder -01:00 |
ZZZ | Der Zeitzonenversatz, ausgedrückt in Zeitzonen-IDs. | America/Los_Angeles |
Die folgende Tabelle zeigt anhand von Beispielen, wie dasselbe Datum – 2. Januar 2016, 21:45:02,05 Uhr – in verschiedenen Formaten dargestellt wird:
Beispiele für Zeitformate
Eingabedatum | Datumsformat |
---|---|
01/02/2016 9:45:02PM | MM/dd/yyyy hh:mm:ssa |
Jan02-16 21:45:02 | MMMdd-yy HH:mm:ss |
Januar 02 2016 9:45:02.050PM | MMMM dd yyyy hh:mm:ss.SSSa |
01/02/2017T9:45:14:05-0000 | MM/dd/yyyy'T'HH:mm:ssZ |
Dataset-Format
Im Abschnitt "Dataset-Format" wird das Format der Daten angegeben. Das Datum kann eines der folgenden Formate aufweisen:
- Shapefile (.shp)
- Durch Trennzeichen getrennte Datei (z. B. .csv)
- Parquet-Datei
- ORC-Datei
Die verfügbaren Parameter variieren abhängig vom Dataset. Für Shapefiles, ORC- und Parquet-Dateien ist der einzige Parameter der Dateityp und kann nicht geändert werden. Ist das Eingabe-Dataset eine durch Trennzeichen getrennte Datei, können mehrere Parameter im Manifest im Manager geändert werden. Diese werden in der folgenden Tabelle veranschaulicht:
Dataset-Formate
Parameter | Beschreibung |
---|---|
Dateierweiterung | Führt die Dateierweiterung für das Eingabe-Dataset auf. Gebräuchliche Formate sind .csv und .txt. Diese Informationen können in der Hint-Datei angegeben werden. |
Feldtrennzeichen | Bestimmt das Trennzeichen für jedes Feld. Gebräuchliche Formate sind , und ;. Diese Informationen können in der Hint-Datei angegeben werden. |
Datensatzabschlusszeichen | Bestimmt das Abschlusszeichen für jede Datenzeile. Gebräuchliche Formate sind \n und \t. Diese Informationen können in der Hint-Datei angegeben werden. |
Anführungszeichen | Bestimmt das verwendete Anführungszeichen. Diese Informationen können in der Hint-Datei angegeben werden. |
Hat Kopfzeile | Ein boolescher Wert, der bestimmt, ob die Eingabetabelle eine Kopfzeile aufweist. Wenn eine Kopfzeile enthalten ist, werden die Überschriften für die Feldnamen verwendet. Geometrie- und Zeitfelder werden durch die Feldnameninformationen vorhergesagt. Überschriften können mithilfe der Hint-Datei festgelegt werden. |
Codierung | Der Typ der für die Datei verwendeten Codierung. Standardmäßig ist dieser UTF-8. Dies kann in der Hint-Datei festgelegt werden. |