Skip To Content

Strategien für den Datentransfer zu Amazon Web Services

Durch die Bereitstellung von ArcGIS Enterprise in Amazon Web Services (AWS) können Sie vom Komfort und von der Skalierbarkeit einer Cloud-Umgebung für das Hosting Ihrer Web-Services profitieren. Endbenutzer können diese Web-Services in Anwendungen auf ihren lokalen Geräten oder in anderen Anwendungen in der Cloud verwenden.

Als Administrator einer ArcGIS-Bereitstellung in AWS müssen Sie dafür sorgen, dass Publisher die von Endbenutzern benötigten Services erstellen können. Einige Services können von lokalen oder Web-Clients veröffentlicht werden, wobei die Daten zum Zeitpunkt der Veröffentlichung kopiert werden. In den meisten Fällen hingegen müssen GIS-Daten über das Internet an Speicherorte in der Cloud übertragen werden. Auf dieser Seite sind Optionen zum Veröffentlichen und Kopieren von Daten, zum Übertragen von Daten auf AWS, sofern erforderlich, und zum Speicherort für Daten auf AWS aufgelistet. Außerdem werden die Faktoren erläutert, die die Übertragungszeit beeinflussen.

Nutzen von Webschnittstellen

Der Zugriff auf ArcGIS Server Manager und das ArcGIS Enterprise-Portal erfolgt über einen Webbrowser. Das bedeutet, dass Sie sich auf Ihrem lokalen Desktop bei diesen Anwendungen anmelden können, ohne sich bei den Amazon Elastic Compute Cloud (EC2)-Instanzen in AWS anmelden zu müssen.

Sie können in der lokalen ArcGIS Pro-Installation eine Service-Definitionsdatei mit den Daten erstellen, die der Service enthalten soll. Sobald Sie diese Datei vorliegen haben, melden Sie sich über Manager bei der eigenständigen oder verbundenen ArcGIS Server-Site unter AWS Server Manager an, und veröffentlichen Sie anhand der Service-Definitionsdatei.

Wenn Sie ArcGIS Enterprise unter AWS bereitstellen, können Sie sich beim Portal als Benutzer mit Berechtigungen zum Erstellen von Inhalten und gehosteten Feature-Layern, zum Hochladen von Datenquellen wie gezippten Shapefiles, gezippten File-Geodatabases oder Dateien mit kommagetrennten Werten (CSV-Dateien) auf das Portal sowie zum Veröffentlichen von gehosteten Feature-Layern anmelden, die Sie für andere Mitglieder Ihrer Organisation freigeben können.

Wenn Sie ArcGIS GeoEvent Server auf Ihrer EC2-Instanz konfiguriert haben, können Sie Live-Daten-Feeds streamen. Weitere Informationen finden Sie in der ArcGIS GeoEvent Server-Hilfe.

Replizieren von Daten über einen Geodatenservice

Sie können eine Verbindung zu einer ArcGIS Server-Site auf AWS herstellen, und zwar über eine Installation von ArcGIS Pro auf Ihrem lokalen Computer, und sowohl Ihre lokale Enterprise-Geodatabase als auch eine Enterprise-Geodatabase auf AWS registrieren, einen Geodaten-Service der Geodatabase auf AWS veröffentlichen und den Geodaten-Service zum Replizieren von Daten aus der lokalen Geodatabase auf die Geodatabase auf AWS verwenden.

Verschieben von Daten nach AWS

In manchen Fällen kann es notwendig sein, Daten nach AWS zu verschieben. Die Publisher müssen sich dann bei einer der AWS-Instanzen anmelden, die Sie erstellt haben, die eine lizenzierte Kopie von ArcGIS Pro enthält, und dort Karten erstellen und Daten veröffentlichen. Diese Vorgehensweise ist in den folgenden Fällen notwendig:

  • Sie speichern Ihre Quelldaten in AWS.
  • Sie verschieben für die Veröffentlichung einen Teil der Quelldaten nach AWS, da das Veröffentlichen von Daten aus lokalen Datenquellen für eine ArcGIS Server-Site in der Cloud sehr lange dauern kann und daher in vielen Fällen nicht empfehlenswert ist.

Speicherorte für die Daten in AWS

Die Speicherung der GIS-Daten kann an mehreren Speicherorten in AWS erfolgen. Für alle nachfolgend aufgeführten Optionen fallen an Amazon zu entrichtende Gebühren an, die Änderungen unterliegen und zu denen Sie die entsprechenden Informationen einholen sollten, bevor Sie eine Auswahl treffen. Speichern Sie die Daten in derselben Region in AWS wie Ihre ArcGIS Server-Site und ArcGIS Pro-Installation.

  • Amazon Elastic Block Store-Volumes (EBS): EBS-Volumes sind virtuelle Laufwerke, die Sie an die EC2-Instanz anfügen können, um mehr Speicherplatz hinzuzufügen. Die Instanzen, die Sie mithilfe der Bereitstellungswerkzeuge von ArcGIS Enterprise on Amazon Web Services starten, enthalten ein Stammvolume. Mit der AWS Management Console können Sie aber auch ein eigenes EBS-Volume hinzufügen, das bereits Daten enthält. Volumes können Datenquellendateien wie File-Geodatabases enthalten und zum Speichern von Karten- und Bild-Caches verwendet werden.

    Lesen Sie hierzu die Übersicht über EBS-Volumes in der AWS-Dokumentation.

  • Amazon Simple Storage Service (S3): Amazon S3 ist ein Amazon-Service, der speziell für die Datenspeicherung in der Cloud vorgesehen ist. Bei dieser Speicheroption ist die Gefahr von Datenfehlern oder -verlusten am niedrigsten. S3 kann als Speicherort für Datensicherungen, als Mittelweg beim Datentransfer zwischen der lokalen Bereitstellung und Ihren EBS-Volumes oder als Speicherort für Karten- und Bild-Caches und Big-Data-Dateifreigaben verwendet werden, die Sie bei einer ArcGIS Server-Site in AWS registrieren.

    Lesen Sie hierzu die Übersicht über S3 in der AWS-Dokumentation.

  • EC2-Instanz: Sie können Daten direkt in das Stammvolume der EC2-Instanz übertragen.
  • Datenbank-Services: Wenn Sie Bereitstellungswerkzeuge von ArcGIS Enterprise on Amazon Web Services verwenden, können Sie eine in einem Amazon Relational Database Service (RDS) gespeicherte Enterprise-Geodatabase einbinden. Sie können Daten in diese Geodatabases laden oder Inhalte in diesen Geodatabases erstellen, um sie als Quelldaten für Ihre Web-Services zu verwenden. Weitere Informationen finden Sie unter Geodatabases unter Amazon Web Services.
  • ArcGIS Data Store: Eine der Komponenten einer ArcGIS Enterprise-Bereitstellung ist ArcGIS Data Store. Hier werden Daten gespeichert, die von verschiedenen gehosteten Feature-Layern verwendet werden. Wenn Sie ArcGIS Enterprise auf AWS bereitstellen und gehostete Web-Layer veröffentlichen, können Daten in einen der mit ArcGIS Data Store erstellten Data Stores kopiert werden. Weitere Informationen finden Sie unter Was ist ArcGIS Data Store

Optionen zum Übertragen von Daten an die Cloud

Die Datenübertragung von der lokalen Bereitstellung an die Cloud nimmt viel Zeit in Anspruch und bedarf in manchen Fällen der Koordination mit dem Sicherheitspersonal der IT-Abteilung. Das Exportieren von Daten an einen Speicherort in der Cloud ist häufig nicht so schnell und sicher wie allgemeine Datentransfers innerhalb des lokalen Netzwerks.

Es stehen viele Strategien zum Übertragen von Daten an die Cloud zur Verfügung, wenn Sie jedoch mit sensiblen Daten arbeiten, müssen Sie sich mit dem IT-Personal abstimmen, um sicherzustellen, dass die gewählte Methode sicher und von der Organisation genehmigt ist. Im Folgenden finden Sie einige Optionen:

  • Kopieren der Daten beim Veröffentlichen eines Service.

    Beim Veröffentlichen eines Service können die Daten für diesen Service auf die ArcGIS Server-Site oder in den ArcGIS Data Store kopiert werden. Je nach Typ des veröffentlichten Service werden die Daten in eine Service-Definitionsdatei (.sd) gepackt, in das Upload-Verzeichnis der ArcGIS Server-Site übertragen und schließlich im Eingabeverzeichnis von ArcGIS Server entpackt. Oder die Daten werden in einen der ArcGIS Data Store-Typen in Ihrer Bereitstellung kopiert. Beachten Sie, dass dieser Vorgang lange dauern und die Übertragung großer Datenmengen mit sich bringen kann, wenn Sie die in der Karte und anderen Ressourcen verwendeten Ausdehnungen und Datasets nicht beschränken.

    Mit dieser Option können weder Daten zwischen Services freigegeben noch Daten zwischen der Cloud und der lokalen Bereitstellung synchronisiert werden.

  • Erstellen Sie eine Enterprise-Geodatabase in AWS, und registrieren Sie sie als verwaltete Datenbank für eine eigenständige oder eine verbundene ArcGIS Server-Site.

    Wenn Sie Feature-Services in der ArcGIS Server-Site veröffentlichen, werden die Daten in die verwaltete Datenbank kopiert.

    Wie bei der vorherigen Option, können mit dieser Option weder Daten zwischen Services freigegeben noch Daten zwischen der Cloud und der lokalen Bereitstellung synchronisiert werden.

    Weitere Informationen zum Auffüllen einer Geodatabase auf AWS finden Sie unter Strategien zum Laden von Daten in eine Geodatabase unter Amazon Web Services.

  • Verwenden Sie zum Kopieren und Einfügen der Daten eine Remotedesktopverbindung.

    Microsoft Windows-Remotedesktopverbindungen ermöglichen die Umleitung von Dateisystemen, in denen lokale Laufwerke dem Remotecomputer zugeordnet werden können. Wenn Sie sich über Remotedesktop bei der EC2-Instanz unter Windows angemeldet haben, können Sie Windows Explorer öffnen und Daten von der lokalen Festplatte auf die EBS-Volumes kopieren.

    Wenn Sie sensible Daten über eine Remotedesktopverbindung übertragen möchten, stellen Sie sicher, dass zusätzliche Sicherheitsstufen vorhanden sind. Ältere Versionen von Remotedesktopverbindungen enthielten Sicherheitsrisiken, bei denen ein Server, der sich als Computer ausgibt, Zugriff auf Ihre Daten erlangen kann (auch als Man-in-the-Middle-Angriffe bekannt).

    Hinweis:

    Die Datenübertragung per Kopieren und Einfügen kann einige Zeit in Anspruch nehmen. Kopieren Sie keine Dateien oder Daten, bevor der Einfügevorgang abgeschlossen ist. Andernfalls wird der Einfügevorgang beendet und Sie müssen von vorn beginnen.

  • Verwenden Sie S3-Client-Dienstprogramme.

    Amazon S3 kann als Mittelweg beim Verschieben von Daten von der lokalen Bereitstellung auf die EBS-Volumes verwendet werden. Um Daten in S3 zu laden, können Sie die AWS Management Console oder eine Drittanbieteranwendung verwenden, die zum Verschieben von Dateien zwischen S3 und eigenen Computern konzipiert sind. Sobald die Daten in S3 geladen sind, können Sie das gleiche Dienstprogramm auf der EC2-Instanz zum Übertragen von Daten aus S3 in die Instanz verwenden.

  • Zugriff auf die von Ihrem eigenen Webserver bereitstellten Daten.

    Die EC2-Instanz kann auf alle im Internet über HTTP verfügbaren Daten zugreifen. Wenn Sie über einen webbasierten Server in Ihrer Organisation verfügen, können Sie Daten auf diesem Server ablegen und sie anschließend von der EC2-Instanz herunterladen. Der Vorteil dieses Ansatzes besteht darin, dass Sie Sicherheit auf dem Webserver konfigurieren können, um den Zugriff auf die Daten einzuschränken und die Transaktion über SSL zu verschlüsseln.

  • Aktivieren von FTP

    Sie können FTP (File Transfer Protocol) aktivieren, um Dateien direkt auf die EC2-Instanz hochzuladen. Beachten Sie, das Standard-FTP Informationen nicht verschlüsselt und Kennwörter in Klartext überträgt. Um FTP sicher zu verwenden, müssen Sie zusätzliche Sicherheitsmaßnahmen, wie die Verschlüsselung der FTP-Sitzungen mit SSL, das Einschränken der Benutzer, die berechtigt sind, Daten per FTP auf die Instanz zu übertragen und das Deaktivieren von FTP nach dem ersten Datentransfer, ergreifen. Einige Produkte von Drittanbietern dienen dazu, Sie beim Einrichten sicherer FTP-Verbindungen zu unterstützen.

  • Nutzen Sie AWS-Werkzeuge.

    Wenn Sie enorm große Datenmengen an AWS übertragen müssen, ist es möglicherweise schneller und/oder kosteneffizienter, die Daten auf einem mobilen Speichergerät an Amazon zu senden und Amazon eine Gebühr für das direkte Laden der Daten in S3 zu zahlen. Amazon bietet diesen Service unter dem Namen AWS Snowball an.

Amazon arbeitet mit vielen Lösungsanbietern zusammen, von denen einige Datentransfer-, Speicher- und Sicherheitslösungen bereitstellen. Informationen dazu, ob eines dieser Unternehmen Ihnen bei Ihrer Cloud-Strategie helfen kann, finden Sie im AWS Partner Solutions Finder. Esri ist einer dieser Anbieter und stellt die unterschiedlichsten Projekt- und Implementierungs-Services für die Bereitstellung von ArcGIS in der Amazon-Cloud zur Verfügung.

Faktoren, die sich auf die Übertragungszeit auswirken

Die Performance der oben genannten Datentransferoptionen kann je nach räumlicher Nähe zur AWS-Region, nach Tageszeit und nach Qualität der Internetverbindung variieren.

Wenn Client, Datenquelle und ArcGIS Enterprise nicht am gleichen Speicherort bereitgestellt werden, ist beim Senden von Daten zwischen der lokalen Komponente und der Cloud mit Performance-Einbußen zu rechnen.

GIS-Datasets, insbesondere Image- und Karten-Caches, können große Mengen Speicherplatz belegen und müssen vor der Übertragung möglicherweise gezippt werden, um die Dateigröße oder die Gesamtzahl der Dateien für eine effizientere Übertragung zu reduzieren (insbesondere bei Karten-Caches). Einige S3-Clientdienstprogramme können die Größe der einzelnen Dateien, die übertragen werden können, oder die Anzahl der Dateien, die gespeichert werden können, beschränken. Zudem ist bei einigen Komprimierungsprogrammen die Menge der Daten, die komprimiert werden kann, begrenzt. Wenn Sie eine Datenübertragungsoption auswählen, sollten Sie die zum Komprimieren der Daten erforderliche Zeit und den damit verbundenen Aufwand berücksichtigen.

Schließlich sollten Sie bei der Verwendung von S3 die Beschränkungen der Anzahl der Buckets, die Sie erstellen können, sowie andere Beschränkungen, die für S3-Buckets bestehen, beachten. Amazon führt diese unter Bucket Restrictions and Limitations auf.

Gewährleisten der Integrität von Datenpfaden

Jedes Mal, wenn Sie Daten in einen neuen Speicherort verschieben, müssen Sie alle Pfade beachten, die auf Daten verweisen, die möglicherweise auch aktualisiert werden müssen. Dies ist ein Problem bei Kartendokumenten, die auf Dutzende von Daten-Layern mit unterschiedlichen Pfaden verweisen können.

Durch Registrieren des Amazon Elastic Compute Cloud-Datenspeicherorts bei Ihrer ArcGIS Server-Site können Sie den Aufwand für das Beheben beschädigter Datenpfade nach der Veröffentlichung reduzieren. Weitere Informationen finden Sie in der ArcGIS Server-Hilfe unter Registrieren von Daten bei ArcGIS Server mit Server Manager.

Eine andere Möglichkeit, den Bedarf an Datenverbindungsreparaturen zu reduzieren, besteht darin, relative Pfade im Kartendokument zu verwenden und Karten und Daten in einem gemeinsamen Ordner zu speichern.