Stratégies de transfert de données vers Amazon Web Services
Dans cette rubrique
- Emplacements de stockage des données
- Options de transfert des données vers le cloud
- Facteurs qui affectent la durée de transfert des données
- Maintien de l'intégrité des chemins d'accès aux données
Pour créer un déploiement SIG avec Amazon Web Services, vous devez transférer certaines ou toutes vos données SIG par Internet vers des emplacements dans le cloud. Cette rubrique dresse la liste des options concernant les emplacements du cloud dans lesquels stocker vos données et concernant le mode de transfert des données. Elle traite également de certains facteurs affectant la durée de transfert des données.
Emplacements de stockage des données
Une fois que vous avez créé une instance EC2 exécutant ArcGIS Server, vous devez préparer le transfert de vos données vers le cloud. Vous pouvez stocker vos données à plusieurs endroits. Toutes les options suivantes entraînent des frais de la part d'Amazon, qui sont susceptibles de changer et sur lesquels vous devez vous informer avant de faire votre choix.
Volumes EBS : les volumes EBS d'Amazon sont des lecteurs de disques virtuels que vous pouvez associer à votre instance EC2 pour augmenter l'espace de stockage. En fait, un volume est toujours attaché pour vous dans le cadre des images virtuelles (AMI) Amazon ArcGIS Server. Vous pouvez configurer la taille de ce volume attaché lorsque vous créez le site dans ArcGIS Server Cloud Builder on Amazon Web Services. Les répertoires ArcGIS Server sont configurés sur ce lecteur, de sorte que lorsque vous publiez des services avec l'option de copie des données vers le serveur, les données vont dans ce volume EBS. Vous pouvez également créer d'autres répertoires sur ce volume pour qu'ils contiennent vos données.
Amazon S3 : Amazon Simple Storage Service (S3) est un service Amazon conçu tout particulièrement pour le stockage des données dans le cloud. Cette options de stockage présente le potentiel le plus faible d'échec ou de perte des données. Vous pouvez utiliser S3 comme emplacement de sauvegarde des données ou comme zone intermédiaire pour le transfert des données entre votre déploiement local et vos volumes EBS. En outre, toutes les captures d'écran que vous créez de vos volumes EBS sont stockés sur S3.
- Instance EC2 : il est possible de transférer des données directement dans votre instance EC2. Toutefois, si l'instance est résiliée, vos données qui se trouvent dans le lecteur C: ou racine sont immédiatement perdues. L'image virtuelle AMI ArcGIS Server attribue un espace relativement peu important (60 Go sur Windows) sur le lecteur C: pour décourager le stockage des données sur ce lecteur. A l'opposé, les volumes EBS attachés, tels que le lecteur D: sont conservés lorsque l'instance est résiliée et ils constituent une option plus sûre pour le stockage des données.
Attention :
Dans un déploiement de production, ne stockez pas de données SIG ou de cache de carte sur le lecteur C: ou sur le lecteur racine de votre instance EC2.
Options de transfert des données vers le cloud
Le transfert des données de votre déploiement local vers le cloud prend du temps et, dans certains cas, demande une certaine collaboration avec votre équipe de sécurité informatique. L'exportation des données vers un emplacement sur Internet (en d'autres termes, le cloud) n'est souvent pas aussi rapide ou sécurisée que les transferts de données courants que vous pouvez faire au sein de votre réseau local.
Vous pouvez faire appel à diverses stratégies pour amener vos données dans le cloud, mais si vous travaillez avec des données confidentielles, il est important de collaborer avec votre équipe informatique pour vous assurer que la méthode que vous avez adoptée est sûre et approuvée par votre organisation. Voici certaines des options à envisager :
Configurer ArcGIS pour copier les données lorsque vous publiez un service : vous pouvez configurer ArcGIS de façon à ce que lorsque vous publiez un service, les données de ce service soient copiées sur le serveur. Les données sont empaquetées dans un fichier de définition de service (.sd), transférées dans le répertoire des chargements ArcGIS Server et enfin décompressées dans le répertoire en entrée ArcGIS Server ou dans une base de données que vous avez inscrite auprès d'ArcGIS Server (comme base de données gérée d'ArcGIS Server). N'oubliez pas que cela peut prendre beaucoup de temps et entraîner le transfert de grandes quantités de données si vous ne limitez pas l'étendue et les jeux de données utilisés dans votre carte ou d'autres ressources.
Cette option ne permet pas de partager les données entre les services, ni de synchroniser les données entre le cloud et votre déploiement local.
Copier et coller avec la connexion Bureau à distance : la connexion Bureau à distance de Windows permet de rediriger le système de fichiers dans lequel vos lecteurs locaux peuvent être mappés à l'ordinateur distant. Lorsque vous êtes connecté à votre instance EC2 sous Windows via le Bureau à distance, vous pouvez ouvrir l'Explorateur Windows et copier des données depuis vos lecteurs locaux vers vos volumes EBS.
Pour que la redirection du système de fichiers soit possible, dans la fenêtre Connexion Bureau à distance, cliquez sur l'onglet Ressources locales et activez la case à cocher pour rendre vos lecteurs disponibles. La formulation varie selon la version de Windows que vous utilisez. Sous Windows 7, vous devez cliquer sur le bouton Plus pour voir l'option permettant de rendre les lecteurs disponibles.
Si vous choisissez de transférer des données confidentielles à l'aide de la connexion Bureau à distance, assurez-vous que des couches de sécurité supplémentaires sont en place. Il a été démontré que les anciennes versions de la connexion Bureau à distance présentaient des failles de sécurité, dans lesquelles un ordinateur se faisant passer pour le serveur pouvait accéder à vos données (phénomène parfois désigné sous le nom d'attaque de l'intercepteur).
Remarque :
Le transfert des données par copier-coller peut prendre beaucoup de temps. Ne copiez pas d'autres fichiers ou données avant la fin de la procédure de collage, car sinon, le collage prend fin et vous devez tout recommencer.
Utilitaires du client S3 : Amazon S3 peut être utilisé comme zone intermédiaire pour déplacer des données de votre déploiement local vers vos volumes EBS. Pour acheminer des données dans S3, vous pouvez utiliser la console de gestion AWS ou l'une des nombreuses applications tierces conçues pour faciliter le déplacement des fichiers entre S3 et vos ordinateurs. Une fois vos données dans S3, vous pouvez utiliser le même utilitaire sur votre instance EC2 pour transférer des données de S3 vers l'instance.
Votre propre serveur Web : toutes les données disponibles sur le Web via HTTP sont accessibles à votre instance EC2. Si votre organisation comporte un serveur Web, vous pouvez placer vos données dessus, puis télécharger les données depuis votre instance EC2. L'avantage de cette méthode est que vous pouvez configurer la sécurité sur votre serveur Web pour restreindre le nombre des personnes habilitées à télécharger les données et pour chiffrer la transaction via SSL.
FTP : vous pouvez activer le protocole FTP (File Transfer Protocol) pour charger les fichiers directement dans votre instance EC2. N'oubliez pas que le protocole FTP standard ne chiffre pas les informations et envoie les mots de passe en texte clair. Pour utiliser le protocole FTP en toute sécurité, vous devez adopter des mesures de sécurité complémentaires, par exemple chiffrer vos sessions FTP avec SSL, limiter le nombre des utilisateurs autorisés à transférer des données vers votre instance via FTP et désactiver FTP après votre transfert de données initial. Certains produits tiers sont conçus pour vous aider à configurer des connexions FTP sécurisées.
AWS Import/Export : si vous devez transférer une énorme quantité de données vers Amazon, il peut être plus rapide et/ou moins coûteux d'expédier les données à Amazon sur un périphérique de stockage mobile et de payer Amazon pour charger les données directement dans S3. Amazon offre ce service via AWS Import/Export.
Si vous envisagez d'utiliser AWS Import/Export, vous devez établir si cette option est appropriée à la confidentialité des données de votre organisation. A chaque fois que vous envoyez un périphérique de stockage mobile par courrier, vous courez le risque (même petit) d'une destruction physique ou d'une interception de vos données. Vous pouvez atténuer ces risques en sauvegardant et en chiffrant les données. Si vous ne parvenez toujours pas à décider si AWS Import/Export est un choix approprié à vos données, contactez Amazon directement.
Amazon travaille avec de nombreux prestataires de solutions, certains proposant des solutions de transfert de données, de stockage et de sécurité. Reportez-vous à la rubrique Trouvez un prestataire de solutions AWS pour savoir si l'une de ces sociétés peut vous aider à mettre au point votre stratégie dans le cloud. Esri lui-même est l'un de ces prestataires et offre différents services d'implémentation et projets pour déployer des données SIG dans le cloud Amazon.
Facteurs qui affectent la durée de transfert des données
Les performances des options de transfert de données ci-dessus peuvent varier selon votre proximité physique au cloud Amazon, l'heure du jour et la qualité de votre connexion à Internet.
Les jeux de données SIG, en particulier l'imagerie et les caches de carte, peuvent occuper un espace important et il peut être nécessaire de les compresser avant le transfert, soit pour réduire la taille du fichier, soit pour réduire le nombre total de fichiers et optimiser l'efficacité du transfert (en particulier dans le cas des caches de carte). Certains utilitaires du client S3 peuvent imposer des limites quant à la taille de chaque fichier que vous pouvez transférer ou au nombre de fichiers individuels que vous pouvez stocker. De plus, certains programmes de compression sont limités quant au volume de données qu'ils peuvent compresser. La durée de la compression et les tâches requises doivent être prises en compte lors du choix de l'option de transfert de données.
Enfin, si vous utilisez S3, n'oubliez pas les limites concernant le nombre de paquets que vous pouvez créer, ainsi que d'autres restrictions inhérentes aux paquets S3. Amazon en dresse la liste dans l'article sur les restrictions et limites liées aux paquets.
Maintien de l'intégrité des chemins d'accès aux données
A chaque fois que vous déplacez des données vers un nouvel emplacement, vous ne devez pas oublier les chemins d'accès référençant ces données, qui doivent peut-être également être mis à jour. Ceci est un problème pour les documents ArcMap, qui peuvent référencer des dizaines de couches de données à différents chemins d'accès.
L'inscription de l'emplacement des données Amazon EC2 auprès de votre serveur ArcGIS peut contribuer à réduire les tâches de résolution des chemins d'accès endommagés après la publication. Reportez-vous à la rubrique Inscription de vos données auprès d'ArcGIS Server à l'aide d'ArcGIS for Desktop.
Vous pouvez par ailleurs vous connecter à votre instance et utiliser ArcMap pour réparer les chemins obsolètes. ArcGIS for Desktop est inclus dans l'image virtuelle AMI ArcGIS Server, ce qui vous permet d'effectuer facilement les réparations.
Pour réduire les réparations requises sur les connexions de données, vous pouvez également utiliser les chemins relatifs dans vos documents ArcMap et stocker vos cartes et données dans un dossier commun.
Vous avez un commentaire à formuler concernant cette rubrique ?