Skip To Content

Strategien für den Datentransfer zu Amazon Web Services

Durch die Bereitstellung von ArcGIS Server oder ArcGIS Enterprise unter Amazon Web Services (AWS) können Sie vom Komfort und von der Skalierbarkeit einer Cloud-Umgebung für das Hosting Ihrer Web-Services profitieren. Endbenutzer von Web-Services müssen sich für ihre Aufgaben in der Regel nicht bei Instanzen unter AWS anmelden, sondern verwenden Anwendungen auf ihren lokalen Geräten, um über Services mit Daten zu arbeiten.

Als Administrator einer ArcGIS-Bereitstellung unter AWS müssen Sie dafür sorgen, dass Publisher die von Endbenutzern benötigten Services erstellen können. Einige Services können von lokalen oder Web-Clients veröffentlicht werden, wobei die Daten zum Zeitpunkt der Veröffentlichung kopiert werden. In manchen Fällen hingegen müssen GIS-Daten über das Internet an Speicherorte in der Cloud übertragen werden. In diesem Thema werden mehrere Möglichkeiten für das Veröffentlichen und Kopieren von Daten beschrieben und Informationen zum Übertragen von Daten nach AWS sowie dazu geliefert, wo Sie die Daten unter AWS speichern können. Außerdem werden einige der Faktoren erläutert, die die Übertragungszeit beeinflussen.

Nutzen von Webschnittstellen

Der Zugriff auf ArcGIS Server Manager und das ArcGIS Enterprise-Portal erfolgt über einen Webbrowser. Das bedeutet, dass Sie sich auf Ihrem lokalen Desktop bei diesen Anwendungen anmelden können, ohne sich bei den Amazon Elastic Compute Cloud (EC2)-Instanzen unter AWS anmelden zu müssen.

Sie können in der lokalen ArcMap-Installation eine Service-Definitionsdatei mit den Daten erstellen, die der Service enthalten soll. Sobald Sie diese Datei vorliegen haben, melden Sie sich über Manager bei der eigenständigen oder verbundenen ArcGIS Server-Site unter AWS Server Manager an, und veröffentlichen Sie anhand der Service-Definitionsdatei.

Wenn Sie ArcGIS Enterprise unter AWS bereitstellen, können Sie sich beim Portal als Benutzer mit Berechtigungen zum Erstellen von Inhalten und gehosteten Feature-Layern, zum Hochladen von Datenquellen wie gezippten Shapefiles, gezippten File-Geodatabases oder Dateien mit kommagetrennten Werten (CSV-Dateien) auf das Portal sowie zum Veröffentlichen von gehosteten Feature-Layern anmelden, die Sie für andere Mitglieder Ihrer Portal-Organisation freigeben können.

Wenn Sie ArcGIS GeoEvent Server auf Ihrer EC2-Instanz konfiguriert haben, können Sie Live-Daten-Feeds streamen. Weitere Informationen finden Sie in der ArcGIS GeoEvent Server-Hilfe.

Replizieren von Daten über einen Geodatenservice

Sie können über eine ArcGIS Server-Installation auf Ihrem lokalen Computer eine Verbindung mit einer ArcMap-Site unter AWS herstellen und sowohl Ihre lokale Enterprise-Geodatabase als auch eine Enterprise-Geodatabase unter AWS registrieren. Anschließend können Sie einen Geodatenservice der Geodatabase unter AWS veröffentlichen und Daten aus der lokalen Geodatabase über diesen Service in die Geodatabase unter AWS replizieren.

Weitere Informationen finden Sie unter Vorschläge zum Konfigurieren von Geodatenservices in der ArcGIS Server-Hilfe.

Verschieben von Daten nach AWS

In manchen Fällen kann es notwendig sein, Daten nach AWS zu verschieben; die Publisher müssen sich dann bei einer der AWS-Instanzen anmelden, die Sie mithilfe eines Esri Amazon Maschine Image (AMI) erstellt haben, welches eine lizenzierte Kopie von ArcGIS Pro enthält, und dort Karten erstellen und Daten veröffentlichen. Diese Vorgehensweise ist in den folgenden Fällen notwendig:

  • Sie speichern Ihre Quelldaten unter AWS.
  • Sie verschieben für die Veröffentlichung einen Teil der Quelldaten nach AWS, da das Veröffentlichen von Daten aus On-Premise-Datenquellen für eine ArcGIS Server-Site in der Cloud sehr lange dauern kann und daher in vielen Fällen nicht empfehlenswert ist.

Speicherorte für die Daten unter AWS

Es gibt mehrere Speicherorte für GIS-Daten, die Sie nach AWS übertragen müssen. Für alle nachfolgend aufgeführten Optionen fallen an Amazon zu entrichtende Gebühren an, die Änderungen unterliegen und zu denen Sie die entsprechenden Informationen einholen sollten, bevor Sie eine Auswahl treffen. Speichern Sie die Daten in derselben Region in AWS wie Ihre ArcGIS Server-Site.

  • Amazon Elastic Block Store-Volumes (EBS): EBS-Volumes sind virtuelle Laufwerke, die Sie an die EC2-Instanz anfügen können, um mehr Speicherplatz hinzuzufügen. Die über Esri AMIs gestarteten Instanzen enthalten ein Stammvolume. Mit der AWS Management Console können Sie aber auch ein eigenes EBS-Volume hinzufügen, das bereits Daten enthält.

    Lesen Sie hierzu die Übersicht über EBS-Volumes in der AWS-Dokumentation.

  • Amazon Simple Storage Service (S3): Amazon S3 ist ein Amazon-Service, der speziell für die Datenspeicherung in der Cloud vorgesehen ist. Bei dieser Speicheroption ist die Gefahr von Datenfehlern oder -verlusten am niedrigsten. S3 kann als Speicherort für Datensicherungen, als Mittelweg beim Datentransfer zwischen der On-Premise-Bereitstellung und Ihren EBS-Volumes oder als Speicherort für Karten- und Bild-Caches und Big-Data-Dateifreigaben verwendet werden, die Sie bei einer ArcGIS Server-Site unter AWS registrieren.

    Lesen Sie hierzu die Übersicht über S3 in der AWS-Dokumentation.

  • EC2-Instanz: Es besteht die Möglichkeit, Daten direkt in das Stammvolume der EC2-Instanz zu übertragen.

Optionen zum Übertragen von Daten an die Cloud

Die Datenübertragung von der lokalen Bereitstellung an die Cloud nimmt viel Zeit in Anspruch und bedarf in manchen Fällen der Koordination mit dem Sicherheitspersonal der IT-Abteilung. Das Exportieren von Daten an einen Speicherort in der Cloud ist häufig nicht so schnell und sicher wie allgemeine Datentransfers innerhalb des lokalen Netzwerks.

Es stehen viele Strategien zum Übertragen von Daten an die Cloud zur Verfügung, wenn Sie jedoch mit sensiblen Daten arbeiten, müssen Sie sich mit dem IT-Personal abstimmen, um sicherzustellen, dass die gewählte Methode sicher und von der Organisation genehmigt ist. Nachfolgend werden einige Optionen aufgeführt:

  • Kopieren der Daten beim Veröffentlichen eines Service.

    Beim Veröffentlichen eines Service können die Daten für diesen Service auf die ArcGIS Server-Site kopiert werden. Die Daten werden in eine Service-Definition-Datei (.sd) gepackt , in das Upload-Verzeichnis der ArcGIS Server-Site übertragen und schließlich im Eingabeverzeichnis von ArcGIS Server entpackt. Beachten Sie, dass dieser Vorgang lange dauern und die Übertragung großer Datenmengen mit sich bringen kann, wenn Sie die in der Karte und anderen Ressourcen verwendeten Ausdehnungen und Datasets nicht beschränken.

    Mit dieser Option können weder Daten zwischen Services freigegeben noch Daten zwischen der Cloud und der lokalen Bereitstellung synchronisiert werden.

  • Erstellen Sie eine Enterprise-Geodatabase unter AWS, und registrieren Sie sie als verwaltete Datenbank für eine eigenständige oder eine verbundene ArcGIS Server-Site.

    Wenn Sie Feature-Services in der ArcGIS Server-Site veröffentlichen, werden die Daten in die verwaltete Datenbank kopiert.

    Wie bei der vorherigen Option, können mit dieser Option weder Daten zwischen Services freigegeben noch Daten zwischen der Cloud und der lokalen Bereitstellung synchronisiert werden.

  • Verwenden Sie zum Kopieren und Einfügen der Daten eine Remotedesktopverbindung.

    Microsoft Windows-Remotedesktopverbindungen ermöglichen die Umleitung von Dateisystemen, in denen lokale Laufwerke dem Remotecomputer zugeordnet werden können. Wenn Sie sich über Remotedesktop bei der EC2-Instanz unter Windows angemeldet haben, können Sie Windows Explorer öffnen und Daten von der lokalen Festplatte auf die EBS-Volumes kopieren.

    Wenn Sie sensible Daten über eine Remotedesktopverbindung übertragen möchten, sollten Sie sicherstellen, dass zusätzliche Sicherheitsstufen vorhanden sind. Ältere Versionen von Remotedesktopverbindungen enthielten Sicherheitsrisiken, bei denen ein Server, der sich als Computer ausgibt, Zugriff auf Ihre Daten erlangen kann (auch als Man-in-the-Middle-Angriffe bekannt).

    Hinweis:

    Die Datenübertragung per Kopieren und Einfügen kann einige Zeit in Anspruch nehmen. Kopieren Sie keine Dateien oder Daten, bevor der Einfügevorgang abgeschlossen ist. Andernfalls wird der Einfügevorgang beendet und Sie müssen von vorn beginnen.

  • Verwenden Sie S3-Client-Dienstprogramme.

    Amazon S3 kann als Mittelweg beim Verschieben von Daten von der lokalen Bereitstellung auf die EBS-Volumes verwendet werden. Um Daten in S3 zu laden, können Sie die AWS Management Console oder eine Drittanbieteranwendung verwenden, die zum Verschieben von Dateien zwischen S3 und eigenen Computern konzipiert sind. Sobald die Daten in S3 geladen sind, können Sie das gleiche Dienstprogramm auf der EC2-Instanz zum Übertragen von Daten aus S3 in die Instanz verwenden.

  • Zugriff auf die von Ihrem eigenen Webserver bereitstellten Daten.

    Die EC2-Instanz kann auf alle im Internet über HTTP verfügbaren Daten zugreifen. Wenn Sie über einen webbasierten Server in Ihrer Organisation verfügen, können Sie Daten auf diesem Server ablegen und sie anschließend von der EC2-Instanz herunterladen. Der Vorteil dieses Ansatzes besteht darin, dass Sie Sicherheit auf dem Webserver konfigurieren können, um den Zugriff auf die Daten einzuschränken und die Transaktion über SSL zu verschlüsseln.

  • Aktivieren von FTP.

    Sie können FTP (File Transfer Protocol) aktivieren, um Dateien direkt auf die EC2-Instanz hochzuladen. Beachten Sie, das Standard-FTP Informationen nicht verschlüsselt und Kennwörter in Klartext überträgt. Um FTP sicher zu verwenden, müssen Sie zusätzliche Sicherheitsmaßnahmen, wie die Verschlüsselung der FTP-Sitzungen mit SSL, das Einschränken der Benutzer, die berechtigt sind, Daten per FTP auf die Instanz zu übertragen und das Deaktivieren von FTP nach dem ersten Datentransfer, ergreifen. Einige Produkte von Drittanbietern dienen dazu, Sie beim Einrichten sicherer FTP-Verbindungen zu unterstützen.

  • Nutzen Sie AWS-Werkzeuge.

    Wenn Sie enorm große Datenmengen an Amazon übertragen müssen, ist es möglicherweise schneller und/oder weitaus kosteneffizienter, die Daten auf einem mobilen Speichergerät an Amazon zu senden und Amazon eine Gebühr für das direkte Laden der Daten in S3 zu zahlen. Amazon bietet diesen Service unter dem Namen AWS Snowball an.

Amazon arbeitet mit vielen Lösungs-Providern zusammen, von denen einige Datentransfer-, Speicher- und Sicherheitslösungen bereitstellen. Weitere Informationen dazu, ob eines dieser Unternehmen Ihnen bei Ihrer Cloud-Strategie helfen kann, finden Sie im AWS Partner Solutions Finder. Esri ist selbst einer dieser Anbieter und stellt die unterschiedlichsten Projekt- und Implementierungs-Services für die Bereitstellung von ArcGIS in der Amazon Cloud zur Verfügung.

Faktoren, die sich auf die Übertragungszeit auswirken

Die Performance der oben genannten Datentransferoptionen kann je nach räumlicher Nähe zur AWS-Region, nach Tageszeit und nach Qualität der Internetverbindung variieren.

Wenn Client, Datenquelle und ArcGIS Enterprise nicht am gleichen Speicherort bereitgestellt werden, ist beim Senden von Daten zwischen der lokalen Komponente und der Cloud mit Performance-Einbußen zu rechnen.

GIS-Datasets, insbesondere Image- und Karten-Caches, können große Mengen Speicherplatz belegen und müssen vor der Übertragung möglicherweise gezippt werden, um die Dateigröße oder die Gesamtzahl der Dateien für eine effizientere Übertragung zu reduzieren (insbesondere bei Karten-Caches). Einige S3-Clientdienstprogramme können die Größe der einzelnen Dateien, die übertragen werden können, oder die Anzahl der Dateien, die gespeichert werden können, beschränken. Zudem ist bei einigen Komprimierungsprogrammen die Menge der Daten, die komprimiert werden kann, begrenzt. Wenn Sie eine Datenübertragungsoption auswählen, sollten Sie die zum Komprimieren der Daten erforderliche Zeit und den damit verbundenen Aufwand berücksichtigen.

Schließlich sollten Sie bei der Verwendung von S3 die Beschränkungen der Anzahl der Buckets, die Sie erstellen können, sowie andere Beschränkungen, die für S3-Buckets bestehen, beachten. Amazon führt diese unter Bucket Restrictions and Limitations auf.

Gewährleisten der Integrität von Datenpfaden

Jedes Mal, wenn Sie Daten in einen neuen Speicherort verschieben, müssen Sie alle Pfade beachten, die auf Daten verweisen, die möglicherweise auch aktualisiert werden müssen. Dies ist ein Problem bei Kartendokumenten, die auf Dutzende von Daten-Layern mit unterschiedlichen Pfaden verweisen können.

Durch Registrieren des Amazon Elastic Compute Cloud-Datenspeicherorts bei Ihrer ArcGIS Server-Site können Sie den Aufwand für das Beheben beschädigter Datenpfade nach der Veröffentlichung reduzieren. Weitere Informationen finden Sie in der ArcGIS Server-Hilfe unter Registrieren von Daten bei ArcGIS Server mit Server Manager.

Eine andere Möglichkeit, den Bedarf an Datenverbindungsreparaturen zu reduzieren, besteht darin, relative Pfade im Kartendokument zu verwenden und Karten und Daten in einem gemeinsamen Ordner zu speichern.