Skip To Content

Estrategias para la transferencia de datos a Amazon Web Services

Implementar ArcGIS Server o ArcGIS Enterprise en Amazon Web Services (AWS) le permite beneficiarse de la comodidad y escalabilidad del entorno en la nube para alojar sus servicios web. Normalmente, los usuarios finales de los servicios web no necesitarán ni desearán conectarse a instancias en AWS para realizar su trabajo, sino que seguirán utilizando las aplicaciones en sus dispositivos locales para trabajar con los datos.

Como administrador de una implementación de ArcGIS en AWS, necesitará asegurarse de que los publicadores pueden crear los servicios que necesitan los usuarios finales. Algunos servicios se pueden publicar desde clientes locales o web, copiando los datos en el momento de la publicación. Sin embargo, en otros casos, puede que necesite transferir datos SIG a través de Internet a ubicaciones en la nube. En este tema se enumeran algunas opciones para publicar y copiar datos, se explica cómo transferir datos a AWS cuando es necesario y dónde puede almacenar datos en AWS. También se tratan algunos factores que afectan al tiempo de transferencia de los datos.

Aproveche las interfaces web

A ArcGIS Server Manager y al sitio web de Portal for ArcGIS se accede mediante un navegador web. Esto significa que puede iniciar sesión en estas aplicaciones desde su escritorio local sin tener que iniciar sesión en las instancias de EC2 en AWS.

Puede crear un archivo de definición de servicio en su instalación local de ArcMap que incluya los datos que desea en el servicio. Una vez que tenga el archivo, inicie sesión en su sitio de ArcGIS Server independiente o federado en AWS mediante Manager y publique desde el archivo de definición de servicio.

Si implementó ArcGIS Enterprise en AWS, puede iniciar sesión en el sitio web del portal como un usuario con privilegios para crear contenido y publicar capas de entidades alojadas, cargar fuentes de datos como, por ejemplo, shapefiles comprimidos, geodatabases de archivos comprimidas o archivos separados comas (CSV) al portal y publicar capas de entidades alojadas que pueda compartir con otros miembros de la organización del portal.

Si ha configurado ArcGIS GeoEvent Server en la instancia de EC2, puede transferir datos en vivo. Consulte la ayuda de ArcGIS GeoEvent Server para obtener más información.

Replicar los datos mediante un servicio de geodatos

Puede conectarse a un sitio de ArcGIS Server en AWS desde una instalación de ArcMap en su equipo local y registrar la geodatabase corporativa local y la geodatabase corporativa en AWS, publicar un servicio de geodatos de su geodatabase en AWS y replicar datos de su geodatabase local a la geodatabase en AWS mediante este servicio. A partir de la versión 10.6.1, las AMI de Esri no incluyen ninguna geodatabase creada previamente para este flujo de trabajo.

Para obtener las instrucciones sobre el uso del flujo de trabajo en la versión 10.6, consulte Utilizar un servicio de geodatos y una réplica conectada. Para obtener las instrucciones sobre cómo completar este flujo de trabajo después de la versión 10.6, consulte Sugerencias para configurar servicios de geodatos en la Ayuda de ArcGIS Server.

Mover datos a AWS

En algunos casos, puede que necesite mover datos a AWS, hacer que los publicadores se conecten a una de las instancias de AWS que creó a partir de una AMI de Esri y en la que configuró ArcGIS Desktop y hacer que los publicadores creen mapas y publiquen datos en ellos. Esto podría ser necesario en los siguientes escenarios:

  • Tiene almacenados sus datos de origen en AWS.
  • Ha movido un subconjunto de datos de origen a AWS para publicarlos, ya que publicar datos desde las fuentes locales a un sitio de ArcGIS Server en la nube puede resultar un proceso lento y, en muchos casos, no se recomienda.

Nota:

Cuando reinicia instancias de AWS, los nombres de los equipos cambian, lo que puede provocar que el administrador de licencias de ArcGIS Desktop deje de funcionar. En la medida de lo posible, debe evitarse el uso de este mecanismo de asignación de licencias en la nube.

Lugares en los que almacenar datos en AWS

Hay varios lugares en los que puede almacenar datos SIG si necesita transferir los datos a AWS. Todas las opciones siguientes están sujetas a la aplicación de cargos por parte de Amazon, susceptibles de ser modificados, y que recomendamos evaluar antes de decidir la opción de su preferencia. Almacene sus datos en la misma región en AWS que su sitio de ArcGIS Server.

  • Volúmenes de EBS: los volúmenes de Amazon Elastic Block Store (EBS) son unidades de disco virtuales que podrá asociar a la instancia de EC2 para incrementar el almacenamiento. Un volumen de EBS siempre está incorporado como parte de las instancias que inicia desde Amazon Machine Images (AMI) de Esri. El tamaño de este volumen incorporado se puede configurar cuando construye el sitio. Los directorios de ArcGIS Server se configuran en esta unidad cuando utiliza CloudFormation o ArcGIS Server Cloud Builder on Amazon Web Services, de modo que, al publicar servicios con la opción de copiar datos en el sitio de ArcGIS Server, los datos se guardan en este volumen de EBS. En este volumen también podrá crear otros directorios que contengan los datos.

    Consulte la Descripción general de EBS de Amazon

  • Amazon S3: el Servicio de almacenamiento simple (S3) de Amazon es un servicio de Amazon diseñado específicamente para el almacenamiento de datos en la nube. Esta opción de almacenamiento tiene las menores probabilidades de errores o pérdidas de datos. S3 puede utilizarse como ubicación para la copia de seguridad de datos o como terreno de paso para la transferencia datos entre la implementación local y los volúmenes de EBS, o como la ubicación de los datos basados en archivos que registra con un sitio de ArcGIS Server en AWS.

    Consulte la Descripción general de S3 de Amazon

  • Instancia de EC2: es posible transferir los datos directamente a la instancia de EC2. No obstante, una vez terminada la instancia, los datos de la unidad C: de Windows o de la unidad raíz de Linux se perderán inmediatamente. Las instancias creadas a partir de las AMI de Esri asignan una cantidad de espacio relativamente pequeña a la unidad C: para disuadir de almacenar datos en esta unidad. Por el contrario, los volúmenes de EBS asociados como, por ejemplo, la unidad D: en instancias de Windows, se conservan cuando termina la instancia y son una opción más segura para el almacenamiento de datos.
    Precaución:

    No almacene datos SIG ni cachés de mapas en la unidad C: o en la unidad raíz de su instancia de EC2 en una implementación de producción.

Opciones para la transferencia de datos a la nube

La transferencia de datos desde la implementación local a la nube requiere tiempo y, en ocasiones, coordinación con el personal de seguridad informática. La exportación de datos a una ubicación de Internet (en otras palabras, a la nube) no suele ser tan rápida ni segura como las transferencias de datos habituales dentro de su red local.

Podrá aplicar diversas estrategias para transferir los datos a la nube, pero si maneja datos sensibles seguramente querrá coordinarse con el personal de TI y verificar que el método sea seguro y esté aprobado por la organización. Estas son algunas de las opciones:

  • Copiar los datos al publicar un servicio: cuando publique un servicio, puede copiar los datos de ese servicio al sitio de ArcGIS Server. Los datos se empaquetan en un archivo de definición de servicio (.sd), se transfieren al directorio de cargas del sitio de ArcGIS Server y por último se desempaquetan en el directorio de entrada de ArcGIS Server o, cuando se publican servicios de entidades, los datos se almacenan en la base de datos administrada del sitio de GIS Server. Tenga en cuenta que este procedimiento puede tardar mucho tiempo y conllevar la transferencia de grandes volúmenes de datos si no limita las extensiones y conjuntos de datos utilizados en el mapa u otros recursos.

    Esta opción no permite que los datos se compartan entre servicios, ni tampoco la sincronización de datos entre la nube y la implementación local.

  • Copiar y pegar por conexión de escritorio remoto: la Conexión de escritorio remoto de Windows permite redireccionar el sistema de archivos, de tal manera que las unidades locales podrán asignarse al equipo remoto. Si ha iniciado sesión en la instancia de EC2 en Windows a través de Escritorio remoto, podrá abrir el Explorador de Windows y copiar los datos desde las unidades locales a los volúmenes de EBS.

    Para activar el redireccionamiento del sistema de archivos, haga clic en la pestaña Recursos locales en la ventana Conexión a Escritorio remoto y active la casilla de verificación para hacer que sus unidades estén disponibles. El texto puede variar en función de la versión de Windows que esté utilizando.

    Si opta por transferir datos sensibles a través de una Conexión de escritorio remoto, deberá asegurarse de que existan capas adicionales de seguridad. Se ha observado que versiones más antiguas de la Conexión de escritorio remoto tienen vulnerabilidades de seguridad, consistentes en que el ordenador que actúa de servidor puede tener acceso a sus datos (un defecto que suele denominarse ataque del man-in-the-middle, o intermediario)

    Nota:

    Mediante el método de copiar y pegar, la transferencia de datos puede tardar un tiempo. No proceda a copiar otros archivos o datos hasta que el procedimiento de pegar haya concluido. De lo contrario, el pegado terminará y tendrá que volver a empezar.

  • Utilidades de cliente de S3: el servicio S3 de Amazon puede utilizarse como terreno de paso para mover datos desde la implementación local a los volúmenes de EBS. Para transferir datos a S3, puede utilizar la Consola de administración de AWS o cualquiera de las muchas aplicaciones de terceros diseñadas para facilitar el traslado de archivos entre S3 y sus equipos. Una vez que los datos estén en S3, podrá emplear la misma utilidad en la instancia de EC2 para transferirlos desde S3 a la instancia. Otra opción es cargar datos basados en archivos en S3 y registrar el bucket de S3 con su sitio de ArcGIS Server en AWS.
  • Su propio servidor web: su instancia de EC2 podrá acceder a todos los datos disponibles en la web a través de HTTP. Si su organización dispone de un servidor conectado a Internet, podrá colocar los datos en él y, a continuación, descargarlos desde la instancia de EC2. La ventaja de este método es que podrá configurar la seguridad del servidor web para limitar quién puede descargar datos y cifrar la transacción mediante SSL.
  • FTP: podrá activar el protocolo de transferencia de archivos (FTP) para cargar archivos directamente en la instancia de EC2. Tenga en cuenta de que el FTP estándar no cifra la información y envía las contraseñas en texto legible. Para utilizar de manera segura el método de FTP, deberá adoptar medidas de seguridad adicionales, como cifrar las sesiones de FTP con SSL, limitar los usuarios autorizados a transferir datos a la instancia a través de FTP, y desactivar FTP después de la transferencia de datos inicial. Hay varios productos de terceros diseñados para configurar de manera segura las conexiones de FTP.
  • AWS Import/Export: si tiene que transferir un gran volumen de datos a Amazon, quizá resulte más rápido o económico enviarlos a Amazon en un dispositivo de almacenamiento portátil y pagar a Amazon para que los cargue directamente en S3. Amazon ofrece este servicio con el nombre de AWS Import/Export.

    Si está valorando la posibilidad de utilizar el servicio AWS Import/Export, tendrá que decidir si se ajusta a las necesidades de confidencialidad de los datos de su organización. Cada vez que se envía un dispositivo por correo, existe el riesgo, por pequeño que sea, de que sea destruido físicamente o de que se intercepten los datos. Estos riesgos pueden mitigarse haciendo una copia de seguridad de los datos y cifrándolos. No obstante, si todavía duda sobre si AWS Import/Export es una opción adecuada, consulte directamente a Amazon.

Amazon trabaja con numerosos proveedores de soluciones, algunos de los cuales ofrecen soluciones de transferencia, almacenamiento y protección de datos. Consulte Encuentre un proveedor de soluciones de AWS en la ayuda de AWS para saber si alguna de estas compañías puede ayudarle con su estrategia de nube. Esri es uno de estos proveedores y ofrece varios servicios de proyectos e implementación para implementar ArcGIS en la nube de Amazon.

Factores que afectan al tiempo de transferencia de los datos

Los resultados de las opciones de transferencia de datos expuestas pueden variar en función de la proximidad física a la nube de Amazon, la hora del día y la calidad de la conexión a Internet.

Los datasets SIG, en especial las imágenes y cachés de mapas, pueden ocupar gran cantidad de espacio y puede ser necesario comprimirlos antes de transferirlos, ya sea para reducir el tamaño de los archivos o para reducir el número total de archivos, con el fin de que la transferencia resulte más eficiente (en especial, en el caso de las cachés de mapas). Algunas utilidades de cliente de S3 limitan el tamaño de los archivos que se pueden transferir o el número de archivos individuales que se pueden almacenar. También algunos programas de compresión limitan el volumen de datos que pueden comprimirse. Asimismo, deberá tener en cuenta el tiempo y el esfuerzo que se requieren para la operación de comprimir a la hora de seleccionar la opción de transferencia de datos de su preferencia.

Por último, si se utiliza S3, tenga en cuenta las limitaciones en cuanto al número de paquetes que podrá crear y otras restricciones aplicables a paquetes en S3. Amazon los enumera en Restricciones y limitaciones de paquetes.

Mantenimiento de la integridad de las rutas de datos

Cada vez que los datos se mueven a una nueva ubicación, es necesario recordar que puede hacer falta actualizar las rutas que hacen referencia a los datos. Se trata de algo especialmente complejo con los documentos cartográficos, con referencias a decenas de capas de datos en diferentes rutas.

El registro de la ubicación de datos de Amazon EC2 con su sitio de ArcGIS Server puede ayudar a reducir el esfuerzo de recomponer rutas de datos rotas después de la publicación. Consulte Registrar los datos con ArcGIS Server utilizando Manager en la ayuda de ArcGIS Server para obtener más información.

Otro método para reducir la necesidad de reparar las conexiones de datos es utilizar rutas relativas en los documentos cartográficos, y guardar los mapas y datos en una carpeta común.