Skip To Content

Stratégies de transfert de données vers Amazon Web Services

Le fait de déployer ArcGIS Server ou ArcGIS Enterprise sur Amazon Web Services (AWS) vous permet de tirer parti de la commodité et de l'évolutivité de l'environnement cloud pour héberger vos services web. Les utilisateurs finaux des services web n'auront en général pas besoin ni ne souhaiteront se connecter à des instances dans AWS pour accomplir leur travail ; ils continueront à utiliser les applications sur leurs appareils locaux pour travailler avec les données via les services.

En tant qu'administrateur d'un déploiement ArcGIS sur AWS, vous devez être sûrs que les éditeurs peuvent créer les services dont les utilisateurs finaux ont besoin. Certains services peuvent être publiés depuis des clients locaux ou Web, en copiant des données au moment de la publication. Dans certains cas, seulement, vous devez transférer les données SIG sur Internet vers les emplacements dans le Cloud. Cette rubrique énumère certaines options permettant de publier et copier des données, de transférer des données vers AWS, le cas échéant, et où stocker les données sur AWS. Elle traite également de certains facteurs affectant la durée de transfert des données.

Tirer parti des interfaces Web

ArcGIS Server Manager et le portail ArcGIS Enterprise sont accessibles via un navigateur Internet. Cela signifie que vous pouvez vous connecter à ces applications à partir de votre bureau local sans avoir à vous connecter aux instances Amazon Elastic Compute Cloud (EC2) sur AWS.

Vous pouvez créer un fichier de définition de service dans votre installation ArcMap locale qui inclut les données que vous souhaitez dans votre service. Une fois que vous avez le fichier, connectez-vous à votre site ArcGIS Server fédéré ou autonome sur AWS via le gestionnaire et publiez à partir du fichier de définition de service.

Si vous déployez ArcGIS Enterprise sur AWS, vous pouvez vous connecter au portail en tant qu'utilisateur disposant de privilèges pour créer du contenu et publier des couches d'entités hébergées, télécharger des sources de données telles que les fichiers de formes compressés, les géodatabases de fichiers compressés, ou les fichiers CSV vers le portail et publier des couches d'entités hébergées que vous pouvez partager avec d'autres membres de l'organisation de votre portail.

Si vous avez configuré ArcGIS GeoEvent Server sur votre instance EC2, vous pouvez diffuser les flux de données en direct. Reportez-vous à l'aide d'ArcGIS GeoEvent Server pour plus d'informations.

Répliquer les données via un service de géodonnées

Vous pouvez vous connecter à un site ArcGIS Server sur AWS depuis une installation de ArcMap sur votre machine sur site et inscrire à la fois votre géodatabase d’entreprise locale et une géodatabase d’entreprise sur AWS, publier un service de géodonnées de votre géodatabase sur AWS et répliquer les données à partir de votre géodatabase locale vers la géodatabase sur AWS via ce service.

Pour plus d’informations, reportez-vous à la rubrique Suggestions concernant la configuration des services de géodonnées dans l’aide de ArcGIS Server.

Transfert de données vers AWS

Dans certains cas, vous devez déplacer les données vers AWS, faire en sorte que les éditeurs se connectent à l’une des instances AWS que vous avez créées à partir d'une image virtuelle AMI fournie par Esri sur laquelle se trouve une copie sous licence de ArcGIS Pro, pour que les éditeurs créent y des cartes et publient des données. Vous devez ce faire dans les scénarios suivants :

  • Vous stockez vos données source sur AWS.
  • Vous déplacez un sous-ensemble de données source vers AWS pour les publier, puisque la publication des données à partir des sources sur site vers un site ArcGIS Server dans le cloud peut être lente et, dans de nombreux cas, n'est pas recommandée.

Emplacements de stockage des données sur AWS

Il existe plusieurs emplacements où vous pouvez stocker les données SIG si vous devez transférer les données vers AWS. Toutes les options suivantes entraînent des frais de la part d’Amazon, pouvant varier et sur lesquels vous devez vous informer avant de faire votre choix. Stockez vos données dans AWS dans la même région que celle de votre site ArcGIS Server.

  • Volumes EBS d’Amazon : les volumes EBS sont des lecteurs de disques virtuels que vous pouvez associer à votre instance EC2 pour augmenter l'espace de stockage. Les instances que vous lancez à partir des AMI fournies par Esri contiennent un volume racine. Vous pouvez ajouter votre propre volume EBS pré-renseigné à l’aide de la console de gestion AWS.

    Consultez la présentation générale d’EBS dans la documentation AWS.

  • Amazon Simple Storage Service (S3) : Amazon S3 est un service Amazon conçu tout particulièrement pour le stockage des données dans le cloud. Cette options de stockage présente le potentiel le plus faible d'échec ou de perte des données. Vous pouvez utiliser S3 comme emplacement pour la sauvegarde des données, comme une zone intermédiaire pour le transfert de données entre votre déploiement sur site et vos volumes EBS, ou comme l'emplacement des caches de carte et d’imagerie ou des partages de fichiers Big Data que vous inscrivez avec un site ArcGIS Server sur AWS.

    Consultez la S3 présentation générale dans la documentation AWS.

  • Instance EC2 : il est possible de transférer des données directement sur le volume racine de votre instance EC2.

Options de transfert des données vers le cloud

Le transfert des données de votre déploiement sur site vers le cloud prend du temps et, dans certains cas, demande une certaine collaboration avec votre équipe de sécurité informatique (IT). L'exportation des données vers un emplacement dans le cloud n'est souvent pas aussi rapide ou sécurisée que les transferts de données courants que vous pouvez faire au sein de votre réseau local.

Différentes stratégies vous permettent de transférer vos données dans le cloud, mais si vous travaillez avec des données confidentielles, collaborez avec votre équipe informatique pour vous assurer que la méthode que vous avez adoptée est sûre et approuvée par votre organisation. Voici certaines des options à envisager :

  • Copier les données lorsque vous publiez un service.

    Lorsque vous publiez un service, vous pouvez copier les données pour ce service vers le site ArcGIS Server. Les données sont empaquetées dans un fichier de définition de service (.sd), transférées dans le répertoire des téléchargements du site ArcGIS Server, et enfin décompressées dans le répertoire en entrée ArcGIS Server. N'oubliez pas que cela peut prendre beaucoup de temps et entraîner le transfert de grandes quantités de données si vous ne limitez pas l'étendue et les jeux de données utilisés dans votre carte ou d'autres ressources.

    Cette option ne permet pas de partager les données entre les services, ni de synchroniser les données entre le cloud et votre déploiement local.

  • Créez une géodatabase sur AWS et inscrivez-la comme la base de données gérée pour un site ArcGIS Server autonome ou fédéré.

    Lorsque vous publiez des services d'entités sur le site ArcGIS Server, les données sont copiées dans la base de données gérée.

    À l’instar de l’option précédente, cette option ne permet pas de partager les données entre les services, ni de synchroniser les données entre le cloud et votre déploiement local.

  • Utilisez une connexion Bureau à distance et copiez et collez les données.

    La connexion Bureau à distance de Microsoft Windows permet de rediriger le système de fichiers dans lequel vos lecteurs locaux peuvent être mappés à l'ordinateur distant. Lorsque vous êtes connecté à votre instance EC2 sous Windows via le Bureau à distance, vous pouvez ouvrir l'Explorateur Windows et copier des données depuis vos lecteurs locaux vers vos volumes EBS.

    Si vous choisissez de transférer des données confidentielles à l'aide de la connexion Bureau à distance, assurez-vous que des couches de sécurité supplémentaires sont en place. Il a été démontré que les anciennes versions de la connexion Bureau à distance présentaient des failles de sécurité permettant à un ordinateur se faisant passer pour le serveur d’accéder à vos données (phénomène parfois désigné sous le nom d'attaque de l'intercepteur).

    Remarque :

    Le transfert des données par copier-coller peut prendre beaucoup de temps. Ne copiez pas d'autres fichiers ou données avant la fin de la procédure de collage, Car sinon, le collage prend fin et vous devez tout recommencer.

  • Utilisez les utilitaires du client S3.

    Amazon S3 peut être utilisé comme zone intermédiaire pour déplacer des données de votre déploiement sur site vers vos volumes EBS. Pour acheminer des données dans S3, vous pouvez utiliser la console de gestion AWS ou une application tierce conçue pour déplacer des fichiers entre S3 et vos ordinateurs. Une fois vos données dans S3, vous pouvez utiliser le même utilitaire sur votre instance EC2 pour transférer des données depuis S3 vers l'instance.

  • Accéder aux données servies depuis votre propre serveur web.

    Toutes les données disponibles sur le web via HTTP sont accessibles à votre instance EC2. Si votre organisation possède un serveur web, vous pouvez y placer vos données, puis les télécharger à partir de votre instance EC2. L'avantage de cette méthode est que vous pouvez configurer la sécurité sur votre serveur Web pour restreindre le nombre des personnes habilitées à télécharger les données et pour chiffrer la transaction via SSL.

  • Activer le protocole FTP.

    vous pouvez activer le protocole FTP (File Transfer Protocol) pour charger les fichiers directement dans votre instance EC2. N'oubliez pas que le protocole FTP standard ne chiffre pas les informations et envoie les mots de passe en texte clair. Pour utiliser le protocole FTP en toute sécurité, vous devez adopter des mesures de sécurité complémentaires, par exemple chiffrer vos sessions FTP avec SSL, limiter le nombre des utilisateurs autorisés à transférer des données vers votre instance via FTP et désactiver FTP après votre transfert de données initial. Certains produits tiers sont conçus pour vous aider à configurer des connexions FTP sécurisées.

  • Utiliser des outils AWS;

    Si vous devez transférer une quantité énorme de données sur Amazon, une solution plus rapide ou moins coûteuse peut être d’expédier les données à Amazon sur un périphérique de stockage portable et de payer Amazon pour effectuer le chargement des données directement dans S3. Amazon propose ce service sous la désignation AWS Snowball.

Amazon collabore avec de nombreux prestataires de solutions, certains proposant des solutions de transfert de données, de stockage et de sécurité. Reportez-vous à la rubrique Trouver un prestataire de solutions AWS dans l’aide AWS pour comprendre si une de ces sociétés peut contribuer à votre stratégie sur le cloud. Esri est un de ces prestataires et offre différents services de projet et de mise en œuvre pour déployer ArcGIS dans le cloud Amazon.

Facteurs qui affectent la durée de transfert des données

Les performances des options de transfert de données ci-dessus peuvent varier selon votre proximité physique par rapport à la région AWS, l'heure de la journée et la qualité de votre connexion à Internet.

Les jeux de données SIG, en particulier l'imagerie et les caches de carte, peuvent occuper un espace important et il peut être nécessaire de les compresser avant le transfert, soit pour réduire la taille du fichier, soit pour réduire le nombre total de fichiers et optimiser l'efficacité du transfert (en particulier dans le cas des caches de carte). Certains utilitaires du client S3 peuvent imposer des limites quant à la taille de chaque fichier que vous pouvez transférer ou au nombre de fichiers individuels que vous pouvez stocker. De plus, certains programmes de compression sont limités quant au volume de données qu'ils peuvent compresser. La durée de la compression et les tâches requises doivent être prises en compte lors du choix de l'option de transfert de données.

Enfin, si vous utilisez S3, n'oubliez pas les limites concernant le nombre de paquets que vous pouvez créer, ainsi que d'autres restrictions inhérentes aux paquets S3. Amazon en dresse la liste dans l'article Restrictions et limites liées aux paquets.

Maintien de l'intégrité des chemins d'accès aux données

Chaque fois que vous transférez des données vers un nouvel emplacement, n'oubliez pas de mettre également à jour les chemins d'accès référençant ces données. Ceci est un problème pour les documents ArcMap, qui peuvent référencer des dizaines de couches de données à différents chemins d'accès.

L'inscription de l'emplacement des données Amazon Elastic Compute Cloud auprès de votre site ArcGIS Server peut contribuer à réduire les tâches de résolution des chemins d'accès endommagés après la publication. Pour plus d'informations, reportez-vous à la rubrique Inscrire vos données auprès de ArcGIS Server à l'aide du Server Manager dans l'aide ArcGIS Server.

Pour réduire les réparations requises sur les connexions de données, vous pouvez également utiliser les chemins relatifs dans vos documents ArcMap et stocker vos cartes et données dans un dossier commun.