Skip To Content

Estrategias para la transferencia de datos a Amazon Web Services

Implementar ArcGIS Server o ArcGIS Enterprise en Amazon Web Services (AWS) le permite beneficiarse de la comodidad y escalabilidad del entorno en la nube para alojar sus servicios web. Normalmente, los usuarios finales de los servicios web no necesitarán ni desearán conectarse a instancias en AWS para realizar su trabajo, sino que seguirán utilizando las aplicaciones en sus dispositivos locales para trabajar con los datos a través de servicios.

Como administrador de una implementación de ArcGIS en AWS, necesitará asegurarse de que los publicadores pueden crear los servicios que necesitan los usuarios finales. Algunos servicios se pueden publicar desde clientes locales o web, copiando los datos en el momento de la publicación. Sin embargo, en otros casos, puede que necesite transferir datos SIG a través de Internet a ubicaciones en la nube. En este tema se enumeran algunas opciones para publicar y copiar datos, se explica cómo transferir datos a AWS cuando es necesario y dónde puede almacenar datos en AWS. También se tratan algunos factores que afectan al tiempo de transferencia de los datos.

Aproveche las interfaces web

A ArcGIS Server Manager y al portal de ArcGIS Enterprise se accede mediante un navegador web. Esto significa que puede iniciar sesión en estas aplicaciones desde su escritorio local sin tener que iniciar sesión en las instancias de Amazon Elastic Compute Cloud (EC2) en AWS.

Puede crear un archivo de definición de servicio en su instalación local de ArcMap que incluya los datos que desea en el servicio. Una vez que tenga el archivo, inicie sesión en su sitio de ArcGIS Server independiente o federado en AWS mediante Manager y publique desde el archivo de definición de servicio.

Si implementa ArcGIS Enterprise en AWS, puede iniciar sesión en el sitio web del portal como un usuario con privilegios para crear contenido y publicar capas de entidades alojadas, cargar fuentes de datos como, por ejemplo, shapefiles comprimidos, geodatabases de archivos comprimidas o archivos separados comas (CSV) al portal y publicar capas de entidades alojadas que pueda compartir con otros miembros de la organización del portal.

Si ha configurado ArcGIS GeoEvent Server en la instancia de EC2, puede transferir datos en vivo. Consulte la ayuda de ArcGIS GeoEvent Server para obtener más información.

Replicar los datos mediante un servicio de geodatos

Puede conectarse a un sitio de ArcGIS Server en AWS desde una instalación de ArcMap en su equipo local y registrar la geodatabase corporativa local y la geodatabase corporativa en AWS, publicar un servicio de geodatos de su geodatabase en AWS y replicar datos de su geodatabase local a la geodatabase en AWS mediante este servicio.

Consulte Sugerencias para configurar servicios de geodatos en la Ayuda de ArcGIS Server para más información.

Trasladar datos a AWS

En algunos casos, puede que necesite trasladar datos a AWS, hacer que los publicadores se conecten a una de las instancias de AWS que creó a partir de una Amazon Machine Image (AMI) de Esri que incluye una copia con licencia de ArcGIS Pro y hacer que los publicadores creen mapas y publiquen datos en ellos. Esto podría ser necesario en los siguientes escenarios:

  • Tiene almacenados sus datos de origen en AWS.
  • Ha trasladado un subconjunto de datos de origen a AWS para publicarlos, ya que publicar datos desde las fuentes locales a un sitio de ArcGIS Server en la nube puede resultar un proceso lento y, en muchos casos, no se recomienda.

Lugares en los que almacenar datos en AWS

Hay varios lugares en los que puede almacenar datos SIG si necesita transferir los datos a AWS. Todas las opciones siguientes están sujetas a la aplicación de cargos por parte de Amazon, susceptibles de ser modificados, y que recomendamos evaluar antes de decidir la opción de su preferencia. Almacene sus datos en la misma región en AWS que su sitio de ArcGIS Server.

  • Volúmenes de Elastic Block Store (EBS) de Amazon: los volúmenes EBS son unidades de disco virtuales que puede asociar a la instancia de EC2 para agregar más almacenamiento. Las instancias que inicia desde las AMI de Esri también contienen un volumen raíz. Puede agregar su propio volumen EBS ya rellenado con la Consola de administración de AWS.

    Lea el resumen de EBS en la documentación de AWS.

  • Amazon Simple Storage Service (S3):Amazon S3 es un servicio de Amazon diseñado específicamente para el almacenamiento de datos en la nube. Esta opción de almacenamiento tiene las menores probabilidades de errores o pérdidas de datos. S3 puede utilizarse como ubicación para la copia de seguridad de datos o como terreno de paso para la transferencia de datos entre la implementación local y los volúmenes de EBS, o como la ubicación de cachés de imágenes o mapas o recursos compartidos de archivos de big data que registre con un sitio de ArcGIS Server en AWS.

    Lea el resumen de S3 en la documentación de AWS.

  • Instancia de EC2: puede transferir datos directamente al volumen raíz de su instancia de EC2.

Opciones para la transferencia de datos a la nube

La transferencia de datos desde la implementación local a la nube requiere tiempo y, en ocasiones, coordinación con el personal de seguridad informática (TI). La exportación de datos a una ubicación en la nube no suele ser tan rápida ni segura como las transferencias de datos habituales realizadas dentro de su red local.

Puede aplicar diversas estrategias para transferir los datos a la nube, pero, si maneja datos sensibles, coordínese con el personal de TI y verificar que el método sea seguro y esté aprobado por la organización. Estas son algunas de las opciones:

  • Copiar los datos cuando publica un servicio.

    Cuando publica un servicio, puede copiar los datos de ese servicio en el sitio de ArcGIS Server. Los datos se empaquetan en un archivo de definición de servicio (.sd), se transfieren al directorio de cargas del sitio de ArcGIS Server y por último se desempaquetan en el directorio de entrada de ArcGIS Server. Tenga en cuenta que este procedimiento puede tardar mucho tiempo y conllevar la transferencia de grandes volúmenes de datos si no limita las extensiones y conjuntos de datos utilizados en el mapa u otros recursos.

    Esta opción no permite que los datos se compartan entre servicios, ni tampoco la sincronización de datos entre la nube y la implementación local.

  • Crear una geodatabase en AWS y registrarla como la base de datos administrada para un sitio de ArcGIS Server federado o independiente.

    Al publicar servicios de entidades en el sitio de ArcGIS Server, los datos se copian en la base de datos administrada.

    Al igual que la opción anterior, esta opción no permite que los datos se compartan entre servicios, ni tampoco la sincronización de datos entre la nube y la implementación local.

  • Usar una Conexión a Escritorio remoto y copiar y pegar los datos.

    Conexión a Escritorio remoto de Microsoft Windows permite redireccionar el sistema de archivos, de tal manera que las unidades locales pueden asignarse al equipo remoto. Si ha iniciado sesión en la instancia de EC2 en Windows a través de Escritorio remoto, podrá abrir el Explorador de Windows y copiar los datos de las unidades locales en los volúmenes de EBS.

    Si opta por transferir datos sensibles a través de una Conexión a Escritorio remoto, deberá asegurarse de que existan capas adicionales de seguridad. Se ha observado que versiones más antiguas de Conexión a Escritorio remoto presentan vulnerabilidades de seguridad que permiten al equipo que actúa de servidor tener acceso a sus datos (un defecto que suele denominarse ataque de intermediarios).

    Nota:

    Mediante el método de copiar y pegar, la transferencia de datos puede tardar un tiempo. No proceda a copiar otros archivos o datos hasta que el procedimiento de pegar haya concluido. De lo contrario, el pegado terminará y tendrá que volver a empezar.

  • Usar utilidades de cliente de S3.

    Puede utilizar Amazon S3 como terreno de paso para trasladar datos desde la implementación local a los volúmenes de EBS. Para transferir datos a S3, puede utilizar la Consola de administración de AWS o cualquiera de las muchas aplicaciones de terceros diseñadas para trasladar archivos entre S3 y sus equipos. Una vez que los datos estén en S3, podrá emplear la misma utilidad en la instancia de EC2 para transferirlos desde S3 a la instancia.

  • Acceder a datos desde su propio servidor web.

    Su instancia de EC2 podrá acceder a todos los datos disponibles en la web a través de HTTP. Si su organización dispone de un servidor conectado a Internet, podrá colocar los datos en él y, a continuación, descargarlos desde la instancia de EC2. La ventaja de este método es que podrá configurar la seguridad del servidor web para limitar quién puede descargar datos y cifrar la transacción mediante SSL.

  • Habilitar FTP.

    Puede habilitar el protocolo de transferencia de archivos (FTP) para cargar archivos directamente en la instancia de EC2. Tenga en cuenta de que el FTP estándar no cifra la información y envía las contraseñas en texto legible. Para utilizar de manera segura el método de FTP, deberá adoptar medidas de seguridad adicionales, como cifrar las sesiones de FTP con SSL, limitar los usuarios autorizados a transferir datos a la instancia a través de FTP, y desactivar FTP después de la transferencia de datos inicial. Hay varios productos de terceros diseñados para configurar de manera segura las conexiones de FTP.

  • Usar herramientas de AWS.

    Si tiene que transferir un gran volumen de datos a Amazon, quizá resulte más rápido o económico enviarlos a Amazon en un dispositivo de almacenamiento portátil y pagar a Amazon para que los cargue directamente en S3. Amazon ofrece este servicio con el nombre de AWS Snowball.

Amazon trabaja con numerosos proveedores de soluciones, algunos de los cuales ofrecen soluciones de transferencia, almacenamiento y protección de datos. Consulte el Buscador de soluciones de socios de AWS para saber si alguna de estas empresas puede ayudarle con su estrategia de nube. Esri es uno de estos proveedores y ofrece varios servicios de proyectos e implementación para implementar ArcGIS en la nube de Amazon.

Factores que afectan al tiempo de transferencia de los datos

Los resultados de las opciones de transferencia de datos expuestas pueden variar en función de la proximidad física a la región de AWS, la hora del día y la calidad de la conexión a Internet.

Los datasets SIG, en especial las imágenes y cachés de mapas, pueden ocupar gran cantidad de espacio y puede ser necesario comprimirlos antes de transferirlos, ya sea para reducir el tamaño de los archivos o para reducir el número total de archivos, con el fin de que la transferencia resulte más eficiente (en especial, en el caso de las cachés de mapas). Algunas utilidades de cliente de S3 limitan el tamaño de los archivos que se pueden transferir o el número de archivos individuales que se pueden almacenar. También algunos programas de compresión limitan el volumen de datos que pueden comprimirse. Asimismo, deberá tener en cuenta el tiempo y el esfuerzo que se requieren para la operación de comprimir a la hora de seleccionar la opción de transferencia de datos de su preferencia.

Por último, si se utiliza S3, tenga en cuenta las limitaciones en cuanto al número de buckets que podrá crear y otras restricciones aplicables a los buckets de S3. Amazon los enumera en Restricciones y limitaciones de buckets.

Mantenimiento de la integridad de las rutas de datos

Cada vez que los datos se mueven a una nueva ubicación, es necesario recordar que puede hacer falta actualizar las rutas que hacen referencia a los datos. Se trata de algo especialmente complejo con los documentos cartográficos, con referencias a decenas de capas de datos en diferentes rutas.

El registro de la ubicación de datos de Amazon Elastic Compute Cloud con su sitio de ArcGIS Server puede ayudar a reducir el esfuerzo de recomponer rutas de datos rotas después de la publicación. Para obtener más información, consulte Registrar los datos con ArcGIS Server mediante Server Manager en la Ayuda de ArcGIS Server para obtener más información.

Otro método para reducir la necesidad de reparar las conexiones de datos es utilizar rutas relativas en los documentos cartográficos, y guardar los mapas y datos en una carpeta común.