Skip To Content

Estrategias para la transferencia de datos a Amazon Web Services

La creación de una implementación SIG con Amazon Web Services requiere la transferencia, a través de Internet, de parte o la totalidad de los datos SIG a ubicaciones en la nube. En este tema se explican algunas opciones de ubicaciones para almacenar los datos en la nube y se describe el modo de transferirlos. También se tratan algunos factores que afectan al tiempo de transferencia de los datos.

Lugares en los que almacenar datos

Una vez creada una instancia de EC2 que ejecute ArcGIS Server, deberá realizar los preparativos para transferir los datos a la nube. Existen varios lugares en los que podrá guardar los datos. Todas las opciones siguientes están sujetas a la aplicación de cargos por parte de Amazon, susceptibles de ser modificados, y que recomendamos evaluar antes de decidir la opción de su preferencia.

  • Volúmenes de EBS: los volúmenes de almacenamiento de bloque elástico (EBS) de Amazon son unidades de disco virtuales que podrá asociar a la instancia de EC2 para incrementar el almacenamiento. De hecho, un volumen siempre está incorporado como parte de Amazon Machine Images (AMI) de ArcGIS Server. El tamaño de este volumen incorporado se puede configurar cuando construye su sitio en ArcGIS Server Cloud Builder on Amazon Web Services. En esta unidad están configurados los directorios de ArcGIS Server, de modo que, al publicar servicios con la opción de copiar datos en el servidor, los datos se guardan en este volumen de EBS. En este volumen también podrá crear otros directorios que contengan los datos.

    Consulte la Descripción general de EBS de Amazon

  • Amazon S3: el Servicio de almacenamiento simple (S3) de Amazon es un servicio de Amazon diseñado específicamente para el almacenamiento de datos en la nube. Esta opción de almacenamiento tiene las menores probabilidades de errores o pérdidas de datos. S3 puede utilizarse como ubicación para la copia de seguridad de datos o como terreno de paso para la transferencia datos desde la implementación local a los volúmenes de EBS. Además, todas las instantáneas creadas de los volúmenes de EBS se guardan en S3.

    Consulte la Descripción general de S3 de Amazon

  • Instancia de EC2: es posible transferir los datos directamente a la instancia de EC2. No obstante, una vez terminada la instancia, los datos de la unidad C: de Windows o de la unidad raíz de Linux se perderán inmediatamente. La AMI de ArcGIS Server asigna una cantidad de espacio relativamente pequeña (60 GB en Windows) a la unidad C: para disuadir de almacenar datos en esta unidad. Por contraposición, los volúmenes de EBS asociados, como la unidad D:, se conservan cuando termina la instancia y son una opción más segura para el almacenamiento de datos.
    Precaución:

    No almacene datos SIG ni cachés de mapas en la unidad C: o en la unidad raíz de su instancia de EC2 en una implementación de producción.

Opciones para la transferencia de datos a la nube

La transferencia de datos desde la implementación local a la nube requiere tiempo y, en ocasiones, coordinación con el personal de seguridad informática. La exportación de datos a una ubicación de Internet (en otras palabras, a la nube) no suele ser tan rápida ni segura como las transferencias de datos habituales dentro de su red local.

Podrá aplicar diversas estrategias para transferir los datos a la nube, pero si maneja datos sensibles seguramente querrá coordinarse con el personal de TI y verificar que el método sea seguro y esté aprobado por la organización. Algunas de las opciones son las siguientes:

  • Cuando publique un servicio, configure ArcGIS para copiar los datos: puede configurar ArcGIS de manera que, al publicar un servicio, los datos de este se copien en el servidor. Los datos se empaquetan en un archivo de definición de servicio (.sd), se transfieren al directorio de cargas de ArcGIS Server y por último se desempaquetan en el directorio de entrada de ArcGIS Server o, cuando se publican servicios de entidades, los datos se almacenan en la base de datos administrada del servidor SIG. Tenga en cuenta que este procedimiento puede tardar mucho tiempo y conllevar la transferencia de grandes volúmenes de datos si no limita las extensiones y conjuntos de datos utilizados en el mapa u otros recursos.

    Esta opción no permite que los datos se compartan entre servicios, ni tampoco la sincronización de datos entre la nube y la implementación local.

  • Copiar y pegar por Conexión a escritorio remoto: la Conexión a escritorio remoto de Windows permite redireccionar el sistema de archivos, de manera que las unidades locales se pueden asignar al equipo remoto. Si ha iniciado sesión en la instancia de EC2 en Windows a través de Escritorio remoto, podrá abrir el Explorador de Windows y copiar los datos desde las unidades locales a los volúmenes de EBS.

    Para activar el redireccionamiento del sistema de archivos, haga clic en la pestaña Recursos locales en la ventana Conexión a Escritorio remoto y active la casilla de verificación para hacer que sus unidades estén disponibles. El texto puede variar en función de la versión de Windows que esté utilizando.

    Si opta por transferir datos sensibles a través de una Conexión de escritorio remoto, deberá asegurarse de que existan capas adicionales de seguridad. Se ha observado que versiones más antiguas de la Conexión de escritorio remoto tienen vulnerabilidades de seguridad, consistentes en que el ordenador que actúa de servidor puede tener acceso a sus datos (un defecto que suele denominarse ataque del man-in-the-middle, o intermediario)

    Nota:

    Mediante el método de copiar y pegar, la transferencia de datos puede tardar un tiempo. No proceda a copiar otros archivos o datos hasta que el procedimiento de pegar haya concluido. De lo contrario, el pegado terminará y tendrá que volver a empezarlo.

  • Utilidades de cliente de S3: el servicio S3 de Amazon se puede utilizar como paso intermedio para mover datos desde la implementación local a los volúmenes de EBS. Para transferir datos a S3, puede utilizar la Consola de administración de AWS o cualquiera de las muchas aplicaciones de terceros diseñadas para facilitar el traslado de archivos entre S3 y sus equipos. Una vez que los datos estén en S3, podrá emplear la misma utilidad en la instancia de EC2 para transferirlos desde S3 a la instancia.

  • Su propio servidor web: todos los datos disponibles en la web a través de HTTP estarán accesibles para su instancia de EC2. Si su organización dispone de un servidor conectado a Internet, podrá colocar los datos en él y, a continuación, descargarlos desde la instancia de EC2. La ventaja de este método es que podrá configurar la seguridad del servidor web para limitar quién puede descargar datos y cifrar la transacción mediante SSL.

  • FTP: puede activar el protocolo de transferencia de archivos (FTP) para cargar archivos directamente en la instancia de EC2. Tenga en cuenta de que el FTP estándar no cifra la información y envía las contraseñas en texto legible. Para utilizar de manera segura el método de FTP, deberá adoptar medidas de seguridad adicionales, como cifrar las sesiones de FTP con SSL, limitar los usuarios autorizados a transferir datos a la instancia a través de FTP, y desactivar FTP después de la transferencia de datos inicial. Hay varios productos de terceros diseñados para configurar de manera segura las conexiones de FTP.

  • AWS Import/Export: si tiene que transferir un gran volumen de datos a Amazon, quizá resulte más rápido o económico enviarlos a Amazon en un dispositivo de almacenamiento portátil y pagar a Amazon para que los cargue directamente en S3. Amazon ofrece este servicio con el nombre de AWS Import/Export.

    Si está valorando la posibilidad de utilizar el servicio AWS Import/Export, tendrá que decidir si se ajusta a las necesidades de confidencialidad de los datos de su organización. Cada vez que se envía un dispositivo por correo, existe el riesgo, por pequeño que sea, de que sea destruido físicamente o de que se intercepten los datos. Estos riesgos pueden mitigarse haciendo una copia de seguridad de los datos y cifrándolos. No obstante, si todavía duda sobre si AWS Import/Export es una opción adecuada, consulte directamente a Amazon.

Amazon trabaja con numerosos proveedores de soluciones, algunos de los cuales ofrecen soluciones de transferencia, almacenamiento y protección de datos. Consulte en Encuentre un proveedor de soluciones de AWS si alguna de esas empresas puede ayudarle en la implementación de su estrategia en la nube. Esri es uno de esos proveedores y dispone de varios servicios de proyectos e implementación para implementar SIG en la nube de Amazon.

Factores que afectan al tiempo de transferencia de los datos

Los resultados de las opciones de transferencia de datos expuestas pueden variar en función de la proximidad física a la nube de Amazon, la hora del día y la calidad de la conexión a Internet.

Los datasets SIG, en especial las imágenes y cachés de mapas, pueden ocupar gran cantidad de espacio y puede ser necesario comprimirlos antes de transferirlos, ya sea para reducir el tamaño de los archivos o para reducir el número total de archivos, con el fin de que la transferencia resulte más eficiente (en especial, en el caso de las cachés de mapas). Algunas utilidades de cliente de S3 limitan el tamaño de los archivos que se pueden transferir o el número de archivos individuales que se pueden almacenar. También algunos programas de compresión limitan el volumen de datos que pueden comprimirse. Asimismo, deberá tener en cuenta el tiempo y el esfuerzo que se requieren para la operación de comprimir a la hora de seleccionar la opción de transferencia de datos de su preferencia.

Por último, si se utiliza S3, tenga en cuenta las limitaciones en cuanto al número de paquetes que podrá crear y otras restricciones aplicables a paquetes en S3. Amazon los enumera en Restricciones y limitaciones de paquetes.

Mantenimiento de la integridad de las rutas de datos

Cada vez que los datos se mueven a una nueva ubicación, es necesario recordar que puede hacer falta actualizar las rutas que hacen referencia a los datos. Se trata de algo especialmente complejo con los documentos cartográficos, con referencias a decenas de capas de datos en diferentes rutas.

El registro de la ubicación de datos de Amazon EC2 en ArcGIS Server puede ayudar a reducir el esfuerzo de recomponer rutas de datos rotas después de la publicación. Consulte Registrar los datos con ArcGIS Server utilizando ArcMap.

Otra opción consiste en iniciar sesión en la instancia y usar ArcMap para reparar las rutas obsoletas. ArcGIS for Desktop está incluido en la AMI de ArcGIS Server para que las reparaciones se puedan realizar con facilidad.

Otro método para reducir la necesidad de reparar las conexiones de datos es utilizar rutas relativas en los documentos cartográficos, y guardar los mapas y datos en una carpeta común.