Skip To Content

Ausgabevorlagen in Big-Data-Dateifreigaben

Big-Data-Dateifreigaben werden über ArcGIS Server Manager als Data Store registriert. Eine Big-Data-Dateifreigabe beschreibt das Eingabe-Dataset mithilfe eines Manifests zur Big-Data-Dateifreigabe sowie mit Vorlagen für das Zurückschreiben der Ergebnisse an den Speicherort der Big-Data-Dateifreigabe. Beim Zurückschreiben eines Ergebnisses in eine Big-Data-Dateifreigabe wird diese automatisch aktualisiert und enthält dann das neue Ausgabe-Dataset als Eingabe-Dataset. In diesem Thema werden das Formatieren der Ausgabevorlagen und ihre möglichen Werte beschrieben. Einen Überblick über Big-Data-Dateifreigaben und die Funktionsweise von Eingabe-Datasets, Ausgabevorlagen und Hints-Dateien finden Sie unter Erste Schritte mit Big-Data-Dateifreigaben.

Hinweis:

In diesem Thema wird das Bearbeiten von Ausgabevorlagen beschrieben. Weitere Informationen zum Anwenden einer Hint-Datei für Dateien mit Trennzeichen finden Sie unter Hint-Dateien.

Die Ausgabevorlagen bestehen aus einer oder mehreren Vorlagen. Die Anzahl der Vorlagen hängt von den Dateitypen und der Formatierung ab, die Sie zum Speichern der Ausgabeergebnisse verwenden möchten. Im folgenden Beispiel sind drei Ausgabevorlagen vorhanden:

"outputTemplates":[
  {.. template1 ..},
  {.. template2 ..},
  {.. template3 ..}
]

Jede Vorlage weist fünf Objekte der obersten Ebene auf, die angewendet werden können. Von diesen Objekten sind name, title und format erforderlich.

{
 "name": "ExampleTemplate", "title": "My Example Template", "format": {}, "geometry": {}, "time": {}
}

Name

Das name-Objekt ist erforderlich und definiert den Namen des Datasets. Der Name muss im Manifest eindeutig sein und darf keine Sonderzeichen enthalten.

Titel

Das title-Objekt ist erforderlich und definiert den Titel, der beim Ausführen eines Werkzeugs angezeigt wird. Der Titel muss im Manifest eindeutig sein und darf Leerzeichen enthalten.

Format

Das Objekt format ist erforderlich und definiert den Ausgabedateityp und dessen Format.

SyntaxBeispiel
"format" : {
 "type" :  "< delimited | shapefile | orc | parquet >",
 "extension" : "< csv | tsv | shp | orc | parquet >",
 "fieldDelimiter" : "< delimiter >",
 "recordTerminator: "< terminator >",
 "quoteChar":  "< character for quotes>",
 "delimited.write.header" :  < true | false >, 
 "encoding" : "< encoding format >",
 "dateFields" : "< date format >"
}

Beispiel für die Verwendung eines Shapefiles:

"format" : {
 "type": "shapefile", "extension": "shp", "dateFields": "YYYY/MM/dd HH:mm:ss"
}

Beispiel für die Verwendung einer durch Trennzeichen getrennten Datei:

"format" : {
 "type": "delimited", "extension": "csv", "fieldDelimiter": ",", "recordTerminator": "\n",  "quoteChar" "\"",
 "hasHeaderRow": true, "encoding" : "UTF-8"
}

Beispiel für die Verwendung einer Parquet-Datei:

"format" : {
 "type": "parquet"
}

Beispiel für die Verwendung einer ORC-Datei:

"format" : {
 "type": "orc"
}

Beschreibung

  • type: Eine erforderliche Eigenschaft, die den Ausgabedatentyp definiert. Hierbei kann es sich um delimited, shapefile, parquet oder orc handeln.
  • extension: Eine erforderliche Eigenschaft, die die Dateierweiterung für durch Trennzeichen getrennte Dateien angibt.
  • fieldDelimiter: Dies muss nur dann verwendet werden, wenn type delimited entspricht. In diesem wird dargestellt, wodurch Felder in der durch Trennzeichen getrennten Datei getrennt werden.
  • recordTerminator: Dies ist unter Linux immer auf \n und unter Windows immer auf \r\n festgelegt. Wenn Sie diese Option ändern, werden dennoch die Standardeinstellungen verwendet.
  • quoteChar: Dies ist nur dann erforderlich, wenn type delimited entspricht. Das Zeichen zeigt an, wie Anführungszeichen in der durch Trennzeichen getrennten Datei angegeben werden.
  • delimited.write.header: Dies ist nur dann erforderlich, wenn type delimited entspricht. Diese Eigenschaft legt fest, ob die erste Zeile in einer durch Trennzeichen getrennten Datei die Feldnamen enthält.
  • encoding: Dies ist immer auf UTF-8 festgelegt. Wenn Sie diese Option ändern, wird dennoch die Standardeinstellung verwendet.
  • dateFields: Legt fest, wie Felder vom Typ date formatiert werden. Dies sind die Felder, die nicht die Zeit des Features (Zeitpunkt oder Intervall) darstellen. Informationen zum Formatieren von Datumsfeldern finden Sie unter Uhrzeitformate.

Einstellungen für durch Trennzeichen getrennte Dateien können nicht über ArcGIS Server Manager erstellt werden. Um die Einstellungen für durch Trennzeichen getrennte Dateien zu ändern, bearbeiten Sie die Vorlagen. Navigieren Sie hierzu zum Administratorverzeichnis für den GeoAnalytics Server, klicken Sie auf data > items > bigDataFileShares und die Big-Data-Dateifreigabe, und klicken Sie auf Bearbeiten. Nehmen Sie die Änderungen vor und klicken Sie auf Aktualisieren.

Geometry

Das geometry-Objekt ist optional. Wenn es nicht angegeben ist, wird das Geometriefeld für Punkte, die in durch Trennzeichen getrennten Dateien, ORC-Dateien und Parquet-Dateien gespeichert sind, im XYZ-Format geschrieben und für Linien und Polygone in durch Trennzeichen getrennten Dateien, ORC-Dateien und Parquet-Dateien im WKT-Format geschrieben. Für Shapefiles werden die Felder in ein Shape-Feld geschrieben.

SyntaxBeispiel
"geometry" : {
 "spatialReference" : {
  "wkid": <wkidNum>,
  "latestwkid" : <latestWkidNum>
  },
 "encodings":[
 {
  "types" : ["< esriGeometryType >"],
  "fields" [
   {
    "name": "<fieldName1>",
    "formats": ["<fieldFormat1>"]
   },
   {
    "name": "<fieldName2>",
    "formats": ["<fieldFormat2>"]
   }
  },
 {...}
 ]
}

Beispiel für die Verwendung einer durch Trennzeichen getrennten Datei mit X- und Y-Werten:

"geometry" : {
 "spatialReference" : {
  "wkid": 3857 }, "encodings": [{
		"types": ["esriGeometryPoint"],		"fields": [{
				"name": "XValue",				"formats": ["x"]			},			{
				"name": "YValue",				"formats": ["y"]			}
		]	},	{
		"types": ["esriGeometryPolyline",			"esriGeometryPolygon"
		],		"fields": [{
			"name": "geometry",			"formats": ["geojson"]		}]	}
]  
}

Beispiel für die Verwendung einer durch Trennzeichen getrennten Datei mit X-, Y- und Z-Werten:

"geometry" : {
	"spatialReference": {
		"wkid": 4326	},	"encodings": [{
	 "types": ["esriGeometryPoint"],		"fields": [{
				"name": "Longitude",				"formats": ["x"]			},			{
				"name": "Latitude",				"formats": ["y"]			},			{
				"name": "Height",				"formats": ["z"]			}
		]	}]
}

Beispiel für die Verwendung einer .tsvDatei:

"geometry" : {
	"spatialReference": {
		"wkid": 3857	},	"encodings": [{
	"types": ["esriGeometryPolygon", "esriGeometryPoint"],   "fields": [{
			"name": "Shapelocation",			"formats": ["WKT"]		}]	}]
}

Beschreibung

Hinweis:

In der obigen Tabelle sind die Standardoptionen für das geometry-Objekt auf Grundlage der Geometrie und des Dateityps dargestellt, die angewendet werden, wenn Sie es nicht angeben. Die folgenden Eigenschaften sind als erforderlich oder optional aufgeführt, wobei vorausgesetzt wird, dass eine Geometrie verwendet wird:

  • spatialReference: Eine erforderliche Eigenschaft, die den Raumbezug für die Ausgabe von Datasets angibt.
    • wkid: Ein Feld, das den Raumbezug angibt, wobei wkid oder latestWkid für ein Dataset mit einer Geometrie erforderlich ist
    • latestWkid: Ein Feld, das den Raumbezug in einer bestimmten Softwareversion angibt, wobei wkid oder latestWkid für ein Dataset mit Geometrie erforderlich ist
  • encodings: Dies ist erforderlich. Diese Option gibt die Codierung der Ausgabegeometrie an. Die Eigenschaft besteht aus zwei Teilen: dem Geometrietyp und den Feldern, in die die Geometrie geschrieben wird.
    • types: Die in dieser Codierung angegebenen Geometrietypen. Die folgenden Optionen sind verfügbar:
      • esriGeometryPoint
      • esriGeometryPolyline
      • esriGeometryPolygon
    • fields: Dies ist erforderlich. Gibt den name eines oder mehrerer Felder zum Speichern von Geometrieergebnissen sowie die formats der Felder an, in denen die Geometrie gespeichert wird.
      • name: Eine erforderliche Eigenschaft zum Benennen des Feldes, das für die Geometrie des Ausgabe-Datasets verwendet wird. Dies gibt den Namen des Feldes an, das zur Darstellung der Geometrie verwendet wird. Hiervon können mehrere Instanzen vorhanden sein.
      • formats: Eine erforderliche Eigenschaft für durch Trennzeichen getrennte Datasets mit einer räumlichen Darstellung. Dies gibt das Format des Feldes an, das zur Darstellung der Geometrie verwendet wird. Es sind mehrere Formate zulässig. Das Geometriefeld von Shapefiles kann nicht angegeben werden. Die folgenden Formattypen werden unterstützt:
        • WKT: Der Standardformattyp für Linien und Polygone, die als durch Trennzeichen getrennte Dateien, ORC-Dateien und Parquet-Dateien gespeichert werden.
        • GeoJSON
        • EsriJSON
        • X, Y,Z: Der Standardformattyp für Punkte, die als durch Trennzeichen getrennte Dateien, ORC-Dateien und Parquet-Dateien gespeichert werden.
        • EsriShape: Diese Option ist nur für ORC- und Parquet-Dateien verfügbar.
        • WKB: Diese Option ist nur für ORC- und Parquet-Dateien verfügbar.

Uhrzeit

Das time-Objekt ist optional. Wenn es nicht angegeben ist und die Ergebnisse aktivierte Zeiteigenschaften aufweisen, wird die Standardeinstellung verwendet.

SyntaxBeispiel
"time" : {
 "timeReference" : {
  "timeZone" : "<timeZone >"
  },
 "encodings":[{
  "types" : ["< instant | interval >",]
  "fields": [
  {
   "name": "<fieldName1>",
   "formats": ["<fieldFormat1>"],
   "role": "< start | end >"
  }
 ]
}]
}

Beispiel für die Verwendung einer Instanz mit mehreren Formaten in den Zeitfeldern:

"time": {
	"timeReference": {
		"timeZone": "UTC"
	},	"encodings": [{
		"types": ["instant"],		"fields": [{
			"name": "iso_time",			"formats": [				"yyyy-MM-dd HH:mm:ss",				"MM/dd/yyyy HH:mm"
			]		}]	}]
}

Beispiel für die Verwendung eines Intervalls mit mehreren Feldern für startTime:

"time": {
	"timeReference": {
		"timeZone": "-0900"
	},	"encodings": [{
		"types": ["interval"],		"fields": [{
				"name": "time_start",				"formats": ["HH:mm:ss"],				"role": "start"
			},			{
				"name": "date_start",				"formats": ["yyyy-MM-dd"],				"role": "start"
			},			{
				"name": "datetime_ending",				"formats": ["yyyy-MM-dd HH:mm:ss"],				"role": "end"
			}
		]	},{
		"types": ["instant"],		"fields": [{
				"name": "time",				"formats": ["HH:mm:ss"],				"role": "start"
			},			{
				"name": "date",				"formats": ["yyyy-MM-dd"]			}
		]	}]
}

Beschreibung

Hinweis:

Da das time-Objekt optional ist, sind die folgenden Eigenschaften als erforderlich oder optional aufgeführt, wobei vorausgesetzt wird, dass time verwendet wird:

  • encodings: Dies ist erforderlich, wenn die Zeit formatiert wird. Diese Option gibt die Codierung der Ausgabezeit an. Die Eigenschaft besteht aus zwei Teilen: dem Zeittyp und den Feldern, in die die Zeit geschrieben wird.
    • types: Die in dieser Codierung angegebenen Geometrietypen. Die folgenden Optionen sind verfügbar:
      • Instant: Für einen einzelnen Zeitpunkt
      • Interval: Für ein Zeitintervall, das durch eine Start- und Endzeit dargestellt wird
    • fields: Dies ist erforderlich. Gibt den name eines oder mehrerer Felder zum Speichern von Zeitergebnissen sowie die formats der Felder an, in denen die Zeit gespeichert wird.
      • name: Eine erforderliche Eigenschaft zum Benennen des Feldes, das für die Zeit des Ausgabe-Datasets verwendet wird. Damit wird der Name des Feldes angeben, das zur Darstellung der Zeit verwendet wird. Hiervon können mehrere Instanzen vorhanden sein.
      • formats: Ein erforderliches Feld, das das Format des Feldes zur Darstellung der Zeit angibt. Es können mehrere Formate für ein einzelnes Feld vorhanden sein (wie oben dargestellt). Dieses Objekt kann mehrmals vorhanden sein. Informationen zur Formatierung von Feldern finden Sie unter Zeitformate im Manifest zur Big-Data-Dateifreigabe.
    • role: Ein erforderliches Feld, wenn timeType interval entspricht. Kann die startTime oder die endTime eines Zeitintervalls darstellen.
  • timeReference: Ein erforderliches Feld (wenn das Dataset zeitaktiviert ist), das die Zeitzone angibt (timeZone).
    • timeZone: Ein optionales Feld von timeReference, das das Zeitzonenformat der Daten angibt. timeZone kann wie folgt formatiert werden:
      • Unter Verwendung des vollständigen Namens der Zeitzone: Pacific Standard Time
      • Unter Verwendung der Abkürzung der Zeitzone: PST
      • Unter Verwendung des Zeitzonenversatzes in Stunden: -0900.