Skip To Content

Stratégies de transfert de données vers Amazon Web Services

Le fait de déployer ArcGIS Server ou ArcGIS Enterprise sur AWS vous permet de tirer parti de la commodité et de l'évolutivité de l'environnement du Cloud pour héberger vos services Web. Les utilisateurs finaux des services Web n'auront en général pas besoin ni ne souhaiteront se connecter à des instances dans AWS pour accomplir leur travail ; ils continueront à utiliser les applications sur leurs appareils locaux pour travailler avec les données via les services.

En tant qu'administrateur d'un déploiement ArcGIS sur AWS, vous devez être sûrs que les éditeurs peuvent créer les services dont les utilisateurs finaux ont besoin. Certains services peuvent être publiés depuis des clients locaux ou Web, en copiant des données au moment de la publication. Dans certains cas, seulement, vous devez transférer les données SIG sur Internet vers les emplacements dans le Cloud. Cette rubrique établit une liste de certaines options pour publier et copier des données, sur le mode de transfert des données vers AWS, le cas échéant, et où vous pouvez stocker les données sur AWS. Elle traite également de certains facteurs affectant la durée de transfert des données.

Tirer parti des interfaces Web

ArcGIS Server Manager et le site Web Portal for ArcGIS sont accessibles via un navigateur Internet. Cela signifie que vous pouvez vous connecter à ces applications à partir de votre bureau local sans avoir à vous connecter aux instances EC2 sur AWS.

Vous pouvez créer un fichier de définition de service dans votre installation ArcMap locale qui inclut les données que vous souhaitez dans votre service. Une fois que vous avez le fichier, connectez-vous à votre site ArcGIS Server fédéré ou autonome sur AWS via le gestionnaire et publiez à partir du fichier de définition de service.

Si vous avez déployé ArcGIS Enterprise sur AWS, vous pouvez vous connecter au site Web du portail en tant qu'utilisateur avec des privilèges pour créer du contenu et publier des couches d'entités hébergées, télécharger des sources de données telles que les fichiers de formes compressés, les géodatabases de fichiers compressés, ou les fichiers CSV vers le portail et publier des couches d'entités hébergées que vous pouvez partager avec d'autres membres de l'organisation de votre portail.

Si vous avez configuré ArcGIS GeoEvent Server sur votre instance EC2, vous pouvez diffuser les flux de données en direct. Reportez-vous à l'aide d'ArcGIS GeoEvent Server pour plus d'informations.

Répliquer les données via un service de géodonnées

Dans ArcMap sur votre machine locale, vous pouvez vous connecter à votre site ArcGIS Server sur AWS et inscrire à la fois votre géodatabase d'entreprise locale et une géodatabase d'entreprise sur AWS, publier un service de géodonnées de votre géodatabase sur AWS et répliquez les données à partir de votre géodatabase locale vers la géodatabase sur AWS via ce service.

Reportez-vous à la rubrique Réplication sur une instance Amazon Web Services à l'aide des services de géodonnées et Utiliser un service de géodonnées et un réplica connecté pour en savoir plus.

Transférer les données vers AWS

Dans certains cas, vous devez déplacer les données vers AWS, faire en sorte que les éditeurs se connectent à une des instances AWS que vous avez créées à partir d'une image virtuelle AMI Esri et sur laquelle vous avez configuré ArcGIS Desktop, et laisser les éditeurs créent des cartes et publient des données ici. Vous devez ce faire dans les scénarios suivants :

  • Vous stockez vos données source sur AWS.
  • Vous déplacez un sous-ensemble de données source vers AWS à publier, puisque la publication des données à partir des sources sur site vers un site ArcGIS Server dans le cloud peut être lente et, dans certains cas, n'est pas recommandée.

Remarque :

Lorsque vous redémarrez des instances AWS, les noms de machine changent, ce qui peut entraîner l'arrêt du gestionnaire de licence ArcGIS Desktop. L'utilisation de ce mécanisme de licence dans le cloud doit être évité, si possible.

Emplacements de stockage des données sur AWS

Il existe plusieurs emplacements où vous pouvez stocker les données du SIG si vous devez transférer les données vers AWS. Toutes les options suivantes entraînent des frais de la part d'Amazon, qui sont susceptibles de changer et sur lesquels vous devez vous informer avant de faire votre choix. Stockez vos données dans la même zone dans AWS que votre site ArcGIS Server.

  • Volumes EBS : les volumes EBS d'Amazon sont des lecteurs de disques virtuels que vous pouvez associer à votre instance EC2 pour augmenter l'espace de stockage. Un volume EBS est toujours attaché pour vous dans le cadre des instances que vous lancez à partir des images virtuelles Amazon (AMI) Esri. Vous pouvez configurer la taille de ce volume attaché lorsque vous créez le site. Les répertoires ArcGIS Server sont configurés sur ce disque lorsque vous utilisez CloudFormation ou ArcGIS Server Cloud Builder on Amazon Web Services, aussi, lorsque vous publier les services avec l'option de copie des données vers le site ArcGIS Server, les données vont dans ce volume EBS. Vous pouvez également créer d'autres répertoires sur ce volume pour qu'ils contiennent vos données.

    Lire la présentation EBS d'Amazon

  • Amazon S3 : Amazon Simple Storage Service (S3) est un service Amazon conçu tout particulièrement pour le stockage des données dans le cloud. Cette options de stockage présente le potentiel le plus faible d'échec ou de perte des données. Vous pouvez utiliser S3 comme emplacement pour la sauvegarde des données, comme une zone intermédiaire pour le transfert de données entre votre déploiement sur site et vos volumes EBS, ou comme l'emplacement des données basées sur le fichier que vous inscrivez avec un site ArcGIS Server sur AWS.

    Lire la présentation S3 d'Amazon

  • Instance EC2 : il est possible de transférer des données directement sur votre instance EC2. Toutefois, si l'instance est supprimée, les données stockées sur le lecteur C: sous Windows, ou sur le lecteur racine sous Linux, sont immédiatement perdues. Les instances créées à partir des images virtuelles AMI Esri attribuent un espace relativement peu important sur le disque C: pour décourager le stockage des données sur ce lecteur. A l'opposé, les volumes EBS attachés, tels que le lecteur D: sur les instances Windows sont conservés lorsque l'instance est résiliée et ils constituent une option plus sûre pour le stockage des données.
    Attention :

    Dans un déploiement de production, ne stockez pas de données SIG ou de cache de carte sur le lecteur C: ou le lecteur racine de votre instance EC2.

Options de transfert des données vers le cloud

Le transfert des données de votre déploiement local vers le cloud prend du temps et, dans certains cas, demande une certaine collaboration avec votre équipe de sécurité informatique. L'exportation des données vers un emplacement sur Internet (en d'autres termes, le cloud) n'est souvent pas aussi rapide ou sécurisée que les transferts de données courants que vous pouvez faire au sein de votre réseau local.

Vous pouvez faire appel à diverses stratégies pour amener vos données dans le cloud, mais si vous travaillez avec des données confidentielles, il est important de collaborer avec votre équipe informatique pour vous assurer que la méthode que vous avez adoptée est sûre et approuvée par votre organisation. Voici certaines des options à envisager :

  • Copiez les données lorsque vous publiez un service : lorsque vous publiez un service, vous pouvez copier les données pour ce service vers le site ArcGIS Server. Les données sont empaquetées dans un fichier de définition de service (.sd), transférées dans le répertoire des téléchargements ArcGIS Server et enfin décompressées dans le répertoire en entrée ArcGIS Server ou, lorsque vous publiez des services d'entités, les données sont placées dans la base de données gérée de GIS Server . N'oubliez pas que cela peut prendre beaucoup de temps et entraîner le transfert de grandes quantités de données si vous ne limitez pas l'étendue et les jeux de données utilisés dans votre carte ou d'autres ressources.

    Cette option ne permet pas de partager les données entre les services, ni de synchroniser les données entre le cloud et votre déploiement local.

  • Copier et coller avec la connexion Bureau à distance : la connexion Bureau à distance de Windows permet de rediriger le système de fichiers dans lequel vos lecteurs locaux peuvent être mappés à l'ordinateur distant. Lorsque vous êtes connecté à votre instance EC2 sous Windows via le Bureau à distance, vous pouvez ouvrir l'Explorateur Windows et copier des données depuis vos lecteurs locaux vers vos volumes EBS.

    Pour que la redirection du système de fichiers soit possible, cliquez sur l'onglet Ressources locales dans la fenêtre Connexion Bureau à distance et cochez la case correspondant aux lecteurs à activer. La formulation varie selon la version de Windows que vous utilisez.

    Si vous choisissez de transférer des données confidentielles à l'aide de la connexion Bureau à distance, assurez-vous que des couches de sécurité supplémentaires sont en place. Il a été démontré que les anciennes versions de la connexion Bureau à distance présentaient des failles de sécurité, dans lesquelles un ordinateur se faisant passer pour le serveur pouvait accéder à vos données (phénomène parfois désigné sous le nom d'attaque de l'intercepteur).

    Remarque :

    Le transfert des données par copier-coller peut prendre beaucoup de temps. Ne copiez pas d'autres fichiers ou données avant la fin de la procédure de collage, Car sinon, le collage prend fin et vous devez tout recommencer.

  • Utilitaires du client S3 : Amazon S3 peut être utilisé comme zone intermédiaire pour déplacer des données de votre déploiement local vers vos volumes EBS. Pour acheminer des données dans S3, vous pouvez utiliser la console de gestion AWS ou l'une des nombreuses applications tierces conçues pour faciliter le déplacement des fichiers entre S3 et vos ordinateurs. Une fois vos données dans S3, vous pouvez utiliser le même utilitaire sur votre instance EC2 pour transférer des données de S3 vers l'instance. Sinon, vous pouvez charger les données basées sur le fichier vers S3 et enregistrer le paquet S3 avec votre site ArcGIS Server sur AWS.
  • Votre propre serveur Web : toutes les données disponibles sur le Web via HTTP sont accessibles à votre instance EC2. Si votre organisation possède un serveur Web, vous pouvez y placer vos données, puis les télécharger à partir de votre instance EC2. L'avantage de cette méthode est que vous pouvez configurer la sécurité sur votre serveur Web pour restreindre le nombre des personnes habilitées à télécharger les données et pour chiffrer la transaction via SSL.
  • FTP : vous pouvez activer le protocole FTP (File Transfer Protocol) pour charger les fichiers directement dans votre instance EC2. N'oubliez pas que le protocole FTP standard ne chiffre pas les informations et envoie les mots de passe en texte clair. Pour utiliser le protocole FTP en toute sécurité, vous devez adopter des mesures de sécurité complémentaires, par exemple chiffrer vos sessions FTP avec SSL, limiter le nombre des utilisateurs autorisés à transférer des données vers votre instance via FTP et désactiver FTP après votre transfert de données initial. Certains produits tiers sont conçus pour vous aider à configurer des connexions FTP sécurisées.
  • AWS Import/Export : si vous devez transférer un volume considérable de données vers Amazon, il peut être plus rapide et/ou moins coûteux d'expédier les données à Amazon sur un périphérique de stockage mobile et de payer Amazon pour charger les données directement dans S3. Amazon offre ce service via AWS Import/Export.

    Si vous envisagez d'utiliser AWS Import/Export, vous devez établir si cette option est appropriée à la confidentialité des données de votre organisation. Chaque fois que vous envoyez un périphérique de stockage mobile par courrier, vous courez néanmoins le risque (même minime) d'une destruction physique ou d'une interception de vos données. Vous pouvez atténuer ces risques en sauvegardant et en chiffrant les données. Si vous ne parvenez toujours pas à décider si AWS Import/Export est un choix approprié à vos données, contactez Amazon directement.

Amazon collabore avec de nombreux prestataires de solutions, certains proposant des solutions de transfert de données, de stockage et de sécurité. Reportez-vous à la rubrique Trouver un prestataire de solutions AWS dans l'aide AWS pour comprendre si une de ces sociétés peut contribuer à votre stratégie sur le cloud. Esri est un de ces prestataires et offre différents services de projet et de mise en œuvre pour déployer ArcGIS dans le cloud Amazon.

Facteurs qui affectent la durée de transfert des données

Les performances des options de transfert de données ci-dessus peuvent varier selon votre proximité physique au cloud Amazon, l'heure du jour et la qualité de votre connexion à Internet.

Les jeux de données SIG, en particulier l'imagerie et les caches de carte, peuvent occuper un espace important et il peut être nécessaire de les compresser avant le transfert, soit pour réduire la taille du fichier, soit pour réduire le nombre total de fichiers et optimiser l'efficacité du transfert (en particulier dans le cas des caches de carte). Certains utilitaires du client S3 peuvent imposer des limites quant à la taille de chaque fichier que vous pouvez transférer ou au nombre de fichiers individuels que vous pouvez stocker. De plus, certains programmes de compression sont limités quant au volume de données qu'ils peuvent compresser. La durée de la compression et les tâches requises doivent être prises en compte lors du choix de l'option de transfert de données.

Enfin, si vous utilisez S3, n'oubliez pas les limites concernant le nombre de paquets que vous pouvez créer, ainsi que d'autres restrictions inhérentes aux paquets S3. Amazon en dresse la liste dans l'article sur les restrictions et limites liées aux paquets.

Maintien de l'intégrité des chemins d'accès aux données

Chaque fois que vous transférez des données vers un nouvel emplacement, n'oubliez pas de mettre également à jour les chemins d'accès référençant ces données. Ceci est un problème pour les documents ArcMap, qui peuvent référencer des dizaines de couches de données à différents chemins d'accès.

L'inscription de l'emplacement des données Amazon EC2 auprès de votre site ArcGIS Server peut contribuer à réduire les tâches de résolution des chemins d'accès endommagés après la publication. Pour plus d'informations, reportez-vous à la rubrique Inscrire vos données auprès d'ArcGIS Server à l'aide du gestionnaire dans l'aide ArcGIS Server pour en savoir plus.

Pour réduire les réparations requises sur les connexions de données, vous pouvez également utiliser les chemins relatifs dans vos documents ArcMap et stocker vos cartes et données dans un dossier commun.