Skip To Content

Strategien für den Datentransfer zu Amazon Web Services

Durch die Bereitstellung von ArcGIS Server oder ArcGIS Enterprise unter Amazon Web Services (AWS) können Sie vom Komfort und von der Skalierbarkeit einer Cloud-Umgebung für das Hosting Ihrer Web-Services profitieren. Endbenutzer von Web-Services müssen sich für ihre Aufgaben in der Regel nicht bei Instanzen unter AWS anmelden, sondern verwenden Anwendungen auf ihren lokalen Geräten, um über Services mit Daten zu arbeiten.

Als Administrator einer ArcGIS-Bereitstellung unter AWS müssen Sie dafür sorgen, dass Publisher die von Endbenutzern benötigten Services erstellen können. Einige Services können von lokalen oder Web-Clients veröffentlicht werden, wobei die Daten zum Zeitpunkt der Veröffentlichung kopiert werden. In manchen Fällen hingegen müssen GIS-Daten über das Internet an Speicherorte in der Cloud übertragen werden. In diesem Thema werden mehrere Möglichkeiten für das Veröffentlichen und Kopieren von Daten beschrieben und Informationen zum Übertragen von Daten nach AWS sowie dazu geliefert, wo Sie die Daten unter AWS speichern können. Außerdem werden einige der Faktoren erläutert, die die Übertragungszeit beeinflussen.

Nutzen von Webschnittstellen

Der Zugriff auf ArcGIS Server Manager und die Portal for ArcGIS-Website erfolgt über einen Webbrowser. Das bedeutet, dass Sie sich auf Ihrem lokalen Desktop bei diesen Anwendungen anmelden können, ohne sich bei den EC2-Instanzen unter AWS anmelden zu müssen.

Sie können in der lokalen ArcMap-Installation eine Service-Definitionsdatei mit den Daten erstellen, die der Service enthalten soll. Sobald Sie diese Datei vorliegen haben, melden Sie sich über Manager bei der eigenständigen oder verbundenen ArcGIS Server-Site unter AWS an, und veröffentlichen Sie anhand der Service-Definitionsdatei.

Wenn Sie ArcGIS Enterprise unter AWS bereitgestellt haben, können Sie sich bei der Portal-Website als Benutzer mit Berechtigungen zum Erstellen von Inhalten und gehosteten Feature-Layern, zum Hochladen von Datenquellen wie gezippten Shapefiles, gezippten File-Geodatabases oder Dateien mit kommagetrennten Werten (CSV-Dateien) auf das Portal sowie zum Veröffentlichen von gehosteten Feature-Layern anmelden, die Sie für andere Mitglieder Ihrer Portal-Organisation freigeben können.

Wenn Sie ArcGIS GeoEvent Server auf Ihrer EC2-Instanz konfiguriert haben, können Sie Live-Daten-Feeds streamen. Weitere Informationen finden Sie in der ArcGIS GeoEvent Server-Hilfe.

Replizieren von Daten über einen Geodatenservice

Sie können über eine ArcMap-Installation auf Ihrem lokalen Computer eine Verbindung mit einer ArcGIS-Server-Site unter AWS herstellen und sowohl Ihre lokale Enterprise-Geodatabase als auch eine Enterprise-Geodatabase unter AWS registrieren. Anschließend können Sie einen Geodatenservice der Geodatabase unter AWS veröffentlichen und Daten aus der lokalen Geodatabase über diesen Service in die Geodatabase unter AWS replizieren. Mit 10.6.1 weisen die Esri AMIs keine vorab erstellte Geodatabase für diesen Workflow auf.

Anweisungen zum Verwenden des Workflow in 10.6 finden Sie unter Verwenden eines Geodatenservice und eines verbundenen Replikats. Anweisungen zum Durchführen dieses Workflow nach 10.6 finden Sie unter Vorschläge zum Konfigurieren von Geodatenservices in der ArcGIS Server-Hilfe.

Verschieben von Daten nach AWS

In manchen Fällen kann es notwendig sein, Daten nach AWS zu verschieben. Publisher müssen sich dann bei einer der AWS-Instanzen anmelden, die Sie mithilfe eines Esri AMI erstellt und auf denen Sie ArcGIS Desktop konfiguriert haben, und dort Karten erstellen und Daten veröffentlichen. Diese Vorgehensweise ist in den folgenden Fällen notwendig:

  • Sie speichern Ihre Quelldaten unter AWS.
  • Sie verschieben für die Veröffentlichung einen Teil der Quelldaten nach AWS, da das Veröffentlichen von Daten aus On-Premise-Datenquellen für eine ArcGIS Server-Site in der Cloud sehr lange dauern kann und daher in vielen Fällen nicht empfehlenswert ist.

Hinweis:

Wenn Sie AWS-Instanzen neu starten, ändern sich die Computernamen, was zur Folge haben kann, dass der ArcGIS Desktop-Lizenzmanager nicht mehr funktioniert. Die Verwendung dieses Lizenzmechanismus in der Cloud sollte nach Möglichkeit vermieden werden.

Speicherorte für die Daten unter AWS

Es gibt mehrere Speicherorte für GIS-Daten, die Sie nach AWS übertragen müssen. Für alle nachfolgend aufgeführten Optionen fallen an Amazon zu entrichtende Gebühren an, die Änderungen unterliegen und zu denen Sie die entsprechenden Informationen einholen sollten, bevor Sie eine Auswahl treffen. Speichern Sie die Daten in derselben Region in AWS wie Ihre ArcGIS Server-Site.

  • EBS-Volumes: EBS-Volumes (Amazon Elastic Block Store) sind virtuelle Laufwerke, die Sie an die EC2-Instanz anfügen können, um mehr Speicherplatz hinzuzufügen. Ein EBS-Volume wird stets als Teil der über Esri Amazon Machine Images (AMIs) gestarteten Instanzen verknüpft. Sie können die Größe dieses verknüpften Datenträgers konfigurieren, wenn Sie die Site erstellen. Da bei Verwendung von CloudFormation oder ArcGIS Server die ArcGIS Server Cloud Builder on Amazon Web Services-Verzeichnisse auf diesem Laufwerk konfiguriert werden, werden die Daten auf diesem EBS-Volume gespeichert, wenn Sie Services mit der Option zum Kopieren von Daten auf die ArcGIS Server-Site veröffentlichen. Sie können auch andere Verzeichnisse für Ihre Daten auf diesem Datenträger erstellen.

    Lesen Sie hierzu die Übersicht über Amazon EBS-Volumes.

  • Amazon S3: Amazon Simple Storage Service (S3) ist ein Amazon-Service, der speziell für die Datenspeicherung in der Cloud vorgesehen ist. Bei dieser Speicheroption ist die Gefahr von Datenfehlern oder -verlusten am niedrigsten. S3 kann als Speicherort für Datensicherungen, als Mittelweg beim Datentransfer zwischen der On-Premise-Bereitstellung und Ihren EBS-Volumes oder als Speicherort für dateibasierte Daten verwendet werden, die Sie bei einer ArcGIS Server-Site unter AWS registrieren.

    Lesen Sie hierzu die Übersicht über Amazon S3-Volumes.

  • EC2-Instanz: Die Daten können direkt auf die EC2-Instanz übertragen werden; wenn die Instanz beendet wird, gehen die Daten vom Laufwerk C: unter Windows bzw. aus dem Stammverzeichnis unter Linux jedoch unmittelbar verloren. Mithilfe der Esri AMIs erstellten Instanzen ist relativ wenig Speicherplatz auf Laufwerk C: zugewiesen, um zu vermeiden, dass Daten auf diesem Laufwerk gespeichert werden. Im Gegensatz dazu werden angefügte EBS-Volumes wie das Laufwerk D: auf Windows-Instanzen beibehalten, wenn die Instanz beendet wird, und bieten daher eine sicherere Option für die Datenspeicherung.
    Vorsicht:

    Speichern Sie in einer Produktionsbereitstellung keine GIS-Daten oder Karten-Caches auf Laufwerk C: oder im Stammverzeichnis der EC2-Instanz.

Optionen zum Übertragen von Daten an die Cloud

Die Datenübertragung von der lokalen Bereitstellung an die Cloud nimmt viel Zeit in Anspruch und bedarf in manchen Fällen der Koordination mit dem Sicherheitspersonal der IT-Abteilung. Das Exportieren von Daten an einen Speicherort im Internet (d. h. in die Cloud) ist häufig nicht so schnell und sicher wie allgemeine Datentransfers innerhalb des lokalen Netzwerks.

Es stehen viele Strategien zum Übertragen von Daten an die Cloud zur Verfügung, wenn Sie jedoch mit sensiblen Daten arbeiten, müssen Sie sich mit dem IT-Personal abstimmen, um sicherzustellen, dass die gewählte Methode sicher und von der Organisation genehmigt ist. Nachfolgend werden einige Optionen aufgeführt:

  • Kopieren der Daten beim Veröffentlichen eines Service: Beim Veröffentlichen eines Service können die Daten für diesen Service auf die ArcGIS Server-Site kopiert werden. Die Daten werden in eine Service-Definitionsdatei (.sd) gepackt, an das Upload-Verzeichnis der ArcGIS Server-Site übertragen und schließlich im Eingangsverzeichnis von ArcGIS Server entpackt oder (beim Veröffentlichen von Feature-Services) in der verwalteten Datenbank der GIS Server-Site abgelegt. Beachten Sie, dass dieser Vorgang lange dauern und die Übertragung großer Datenmengen mit sich bringen kann, wenn Sie die in der Karte und anderen Ressourcen verwendeten Ausdehnungen und Datasets nicht beschränken.

    Mit dieser Option können weder Daten zwischen Services freigegeben noch Daten zwischen der Cloud und der lokalen Bereitstellung synchronisiert werden.

  • Kopieren und Einfügen für Remotedesktopverbindungen: Windows-Remotedesktopverbindungen ermöglichen die Umleitung von Dateisystemen, in denen lokale Laufwerke dem Remotecomputer zugeordnet werden können. Wenn Sie sich über Remotedesktop bei der EC2 angemeldet haben, können Sie Windows Explorer öffnen und Daten von der lokalen Festplatte auf die EBS-Volumes kopieren.

    Klicken Sie zum Aktivieren der Umleitung von Dateisystemen im Fenster Remotedesktopverbindung auf die Registerkarte Lokale Ressourcen , und aktivieren Sie das entsprechende Kontrollkästchen, um die Laufwerke verfügbar zu machen. Die Formulierung ist je nach verwendeter Windows-Version unterschiedlich.

    Wenn Sie sensible Daten über eine Remotedesktopverbindung übertragen möchten, sollten Sie sicherstellen, dass zusätzliche Sicherheitsstufen vorhanden sind. Ältere Versionen von Remotedesktopverbindungen enthielten Sicherheitsrisiken, bei denen ein Server, der sich als Computer ausgibt, Zugriff auf Ihre Daten erlangen kann (auch als Man-in-the-Middle-Angriffe bekannt).

    Hinweis:

    Die Datenübertragung per Kopieren und Einfügen kann einige Zeit in Anspruch nehmen. Kopieren Sie keine Dateien oder Daten, bevor der Einfügevorgang abgeschlossen ist. Andernfalls wird der Einfügevorgang beendet und Sie müssen von vorn beginnen.

  • S3 Clientdienstprogramme: Amazon S3 kann als Mittelweg beim Verschieben von Daten von der lokalen Bereitstellung auf die EBS-Volumes verwendet werden. Um Daten in S3 zu laden, können Sie die AWS Management Console oder eine der vielen Drittanbieteranwendungen verwenden, die für das einfache Verschieben von Dateien zwischen S3 und eigenen Computern konzipiert sind. Sobald die Daten in S3 geladen sind, können Sie das gleiche Dienstprogramm auf der EC2-Instanz zum Übertragen von Daten aus S3 in die Instanz verwenden. Alternativ können Sie dateibasierte Daten in S3 laden und den S3-Bucket bei Ihrer ArcGIS-Server-Site unter AWS registrieren.
  • Ihr eigener Webserver: Die EC2-Instanz kann auf alle im Internet über HTTP verfügbaren Daten zugreifen. Wenn Sie über einen webbasierten Server in Ihrer Organisation verfügen, können Sie Daten auf diesem Server ablegen und sie anschließend von der EC2-Instanz herunterladen. Der Vorteil dieses Ansatzes besteht darin, dass Sie Sicherheit auf dem Webserver konfigurieren können, um den Zugriff auf die Daten einzuschränken und die Transaktion über SSL zu verschlüsseln.
  • FTP: Sie können FTP (File Transfer Protocol) aktivieren, um Dateien direkt auf die EC2-Instanz hochzuladen. Beachten Sie, das Standard-FTP Informationen nicht verschlüsselt und Kennwörter in Klartext überträgt. Um FTP sicher zu verwenden, müssen Sie zusätzliche Sicherheitsmaßnahmen, wie die Verschlüsselung der FTP-Sitzungen mit SSL, das Einschränken der Benutzer, die berechtigt sind, Daten per FTP auf die Instanz zu übertragen und das Deaktivieren von FTP nach dem ersten Datentransfer, ergreifen. Einige Produkte von Drittanbietern dienen dazu, Sie beim Einrichten sicherer FTP-Verbindungen zu unterstützen.
  • AWS Import/Export: Wenn Sie enorm große Datenmengen an Amazon übertragen müssen, ist es möglicherweise schneller und/oder weitaus kosteneffizienter, die Daten auf einem mobilen Speichergerät an Amazon zu senden und Amazon eine Gebühr für das direkte Laden der Daten in S3 zu zahlen. Amazon bietet diesen Service als AWS Import/Export an.

    Wenn Sie die Verwendung von AWS-Import/Export in Betracht ziehen, müssen Sie entscheiden, ob es im Hinblick auf die Sensibilität der Daten Ihrer Organisation angebracht ist. Wenn Sie ein Gerät per Post versenden, laufen Sie Gefahr, wenn auch in geringem Maße, dass die Daten physisch zerstört oder abgefangen werden. Diese Risiken können reduziert werden, indem Sie die Daten sichern und verschlüsseln. Falls Sie dennoch Bedenken haben, ob AWS-Import/Export die geeignete Wahl für Ihre Daten ist, wenden Sie sich direkt an Amazon.

Amazon arbeitet mit vielen Lösungs-Providern zusammen, von denen einige Datentransfer-, Speicher- und Sicherheitslösungen bereitstellen. Weitere Informationen dazu, ob eines dieser Unternehmen Ihnen bei Ihrer Cloud-Strategie helfen kann, finden Sie in der AWS-Hilfe unter Find an AWS Solution Provider. Esri ist selbst einer dieser Anbieter und stellt die unterschiedlichsten Projekt- und Implementierungs-Services für die Bereitstellung von ArcGIS in der Amazon Cloud zur Verfügung.

Faktoren, die sich auf die Übertragungszeit auswirken

Die Performance der oben genannten Datentransferoptionen kann je nach räumlicher Nähe zur Amazon Cloud, nach Tageszeit und nach Qualität der Internetverbindung variieren.

GIS-Datasets, insbesondere Image- und Karten-Caches, können große Mengen Speicherplatz belegen und müssen vor der Übertragung möglicherweise gezippt werden, um die Dateigröße oder die Gesamtzahl der Dateien für eine effizientere Übertragung zu reduzieren (insbesondere bei Karten-Caches). Einige S3-Clientdienstprogramme können die Größe der einzelnen Dateien, die übertragen werden können, oder die Anzahl der Dateien, die gespeichert werden können, beschränken. Zudem ist bei einigen Komprimierungsprogrammen die Menge der Daten, die komprimiert werden kann, begrenzt. Wenn Sie eine Datenübertragungsoption auswählen, sollten Sie die zum Komprimieren der Daten erforderliche Zeit und den damit verbundenen Aufwand berücksichtigen.

Schließlich sollten Sie bei der Verwendung von S3 die Beschränkungen der Anzahl der Buckets, die Sie erstellen können, sowie andere Beschränkungen, die für S3 Buckets bestehen, beachten. Diese werden von Amazon unter Bucket Restrictions and Limitations aufgeführt.

Gewährleisten der Integrität von Datenpfaden

Jedes Mal, wenn Sie Daten in einen neuen Speicherort verschieben, müssen Sie alle Pfade beachten, die auf Daten verweisen, die möglicherweise auch aktualisiert werden müssen. Dies ist ein Problem bei Kartendokumenten, die auf Dutzende von Daten-Layern mit unterschiedlichen Pfaden verweisen können.

Durch Registrieren des Amazon EC2-Datenspeicherorts bei Ihrer ArcGIS Server-Site können Sie den Aufwand für das Beheben beschädigter Datenpfade nach der Veröffentlichung reduzieren. Weitere Informationen finden Sie in der ArcGIS Server-Hilfe unter Registrieren von Daten bei ArcGIS Server mit Manager.

Eine andere Möglichkeit, den Bedarf an Datenverbindungsreparaturen zu reduzieren, besteht darin, relative Pfade im Kartendokument zu verwenden und Karten und Daten in einem gemeinsamen Ordner zu speichern.