Skip To Content

Estrategias para la transferencia de datos a Amazon Web Services

En este tema

La creación de una implementación SIG con Amazon Web Services requiere la transferencia, a través de Internet, de algunos o todos los datos SIG a la nube. En este tema se explican algunas opciones para almacenar los datos en la nube y para la forma de transferirlos. También se tratan algunos factores que afectan al tiempo de transferencia de los datos.

Lugares en los que almacenar datos

Una vez creada una instancia de EC2 que ejecute ArcGIS Server, deberá realizar los preparativos para transferir los datos a la nube. Existen varios lugares en los que podrá guardar los datos. Todas las opciones siguientes están sujetas a la aplicación de cargos por parte de Amazon, susceptibles de ser modificados, y que recomendamos evaluar antes de decidir la opción de su preferencia.

  • Volúmenes de EBS: los volúmenes de almacenamiento de bloque elástico (EBS) de Amazon son unidades de disco virtuales que podrá asociar a la instancia de EC2 para incrementar el almacenamiento. De hecho, un volumen siempre está incorporado como parte de Amazon Machine Images (AMI) de ArcGIS Server. El tamaño de este volumen incorporado se puede configurar cuando construye su sitio en ArcGIS Server Cloud Builder on Amazon Web Services. En esta unidad están configurados los directorios de ArcGIS Server, de modo que, al publicar servicios con la opción de copiar datos en el servidor, los datos se guardan en este volumen de EBS. En este volumen también podrá crear otros directorios que contengan los datos.

    Consulte la Descripción general de EBS de Amazon

  • Amazon S3: el Servicio de almacenamiento simple (S3) de Amazon es un servicio de Amazon diseñado específicamente para el almacenamiento de datos en la nube. Esta opción de almacenamiento tiene las menores probabilidades de errores o pérdidas de datos. S3 puede utilizarse como ubicación para la copia de seguridad de datos o como terreno de paso para la transferencia datos desde la implementación local a los volúmenes de EBS. Además, todas las instantáneas creadas de los volúmenes de EBS se guardan en S3.

    Consulte la Descripción general de S3 de Amazon

  • Instancia de EC2: es posible transferir los datos directamente a la instancia de EC2. No obstante, una vez terminada la instancia, los datos de la unidad C: o de la unidad raíz se perderán inmediatamente. La AMI de ArcGIS Server asigna un volumen relativamente pequeño de espacio (60 GB en Windows) a la unidad C: para disuadir del almacenamiento de datos en esta unidad. Por contraposición, los volúmenes de EBS asociados, como la unidad D:, se mantendrán cuando termine la instancia y suponen una opción más segura para el almacenamiento de datos.
    Precaución:

    En una implementación de producción, absténgase de guardar datos SIG y cachés de mapas en la unidad C: o en la unidad raíz de la instancia de EC2.

Opciones para la transferencia de datos a la nube

La transferencia de datos desde la implementación local a la nube requiere tiempo y, en ocasiones, coordinación con el personal de seguridad informática. La exportación de datos a una ubicación de Internet (en otras palabras, a la nube) no suele ser tan rápida ni segura como las transferencias de datos habituales dentro de su red local.

Podrá aplicar diversas estrategias para transferir los datos a la nube, pero si maneja datos sensibles seguramente querrá coordinarse con el personal de TI y verificar que el método sea seguro y esté aprobado por la organización. Algunas de las opciones son las siguientes:

  • Para publicar un servicio, configure ArcGIS para copiar los datos: podrá configurar ArcGIS de manera que, al publicar un servicio, los datos del mismo se copien en el servidor. Los datos están empaquetados en un archivo de definición del servicio (extensión .sd), que se transfiere al directorio de cargas de ArcGIS Server y que, por último, se desempaquetan en el directorio de entrada de ArcGIS Server o en la base de datos que haya registrado con ArcGIS Server (como base de datos administrada de ArcGIS Server). Tenga en cuenta que este procedimiento puede tardar mucho tiempo y conllevar la transferencia de grandes volúmenes de datos si no limita las extensiones y conjuntos de datos utilizados en el mapa u otros recursos.

    Esta opción no permite que los datos se compartan entre servicios, ni tampoco la sincronización de datos entre la nube y la implementación local.

  • Copiar y pegar por conexión de escritorio remoto: la Conexión de escritorio remoto de Windows permite redireccionar el sistema de archivos, de tal manera que las unidades locales podrán asignarse al equipo remoto. Si ha conectado la instancia de EC2 a Windows a través de Escritorio remoto, podrá abrir el Explorador de Windows y copiar los datos desde las unidades locales a los volúmenes de EBS.

    Para activar el redireccionamiento del sistema de archivos, en la ventana Conexión de escritorio remoto haga clic en la pestaña Recursos locales y, a continuación, active la casilla de verificación para que las unidades estén disponibles. El texto puede variar en función de la versión de Windows que esté utilizando. En Windows 7 tendrá que hacer clic en el botón Más para hacer visible la opción que pone disponibles las unidades.

    Si opta por transferir datos sensibles a través de una Conexión de escritorio remoto, deberá asegurarse de que existan capas adicionales de seguridad. Se ha observado que versiones más antiguas de la Conexión de escritorio remoto tienen vulnerabilidades de seguridad, consistentes en que el ordenador que actúa de servidor puede tener acceso a sus datos (un defecto que suele denominarse ataque del man-in-the-middle, o intermediario)

    Nota:

    Mediante el método de copiar y pegar, la transferencia de datos puede tardar un tiempo. No proceda a copiar otros archivos o datos hasta que el procedimiento de pegar haya concluido. De lo contrario, el pegado terminará y tendrá que volver a empezarlo.

  • Utilidades de cliente de S3: el servicio S3 de Amazon puede utilizarse como terreno de paso para mover datos desde la implementación local a los volúmenes de EBS. Para transferir datos a S3, puede utilizar la Consola de administración de AWS o cualquiera de las muchas aplicaciones de terceros diseñadas para facilitar el traslado de archivos entre S3 y sus equipos. Una vez que los datos estén en S3, podrá emplear la misma utilidad en la instancia de EC2 para transferirlos desde S3 a la instancia.

  • Su propio servidor web: su instancia de EC2 podrá acceder a todos los datos disponibles en la web a través de HTTP. Si su organización dispone de un servidor conectado a Internet, podrá colocar los datos allí y, a continuación, descargarlos desde la instancia de EC2. La ventaja de este método es que podrá configurar la seguridad del servidor web para limitar quién puede descargar datos y cifrar la transacción mediante SSL.

  • FTP: podrá activar el protocolo de transferencia de archivos (FTP) para cargar archivos directamente en la instancia de EC2. Tenga en cuenta de que el FTP estándar no cifra la información y envía las contraseñas en texto legible. Para utilizar de manera segura el método de FTP, deberá adoptar medidas de seguridad adicionales, como cifrar las sesiones de FTP con SSL, limitar los usuarios autorizados a transferir datos a la instancia a través de FTP, y desactivar FTP después de la transferencia de datos inicial. Hay varios productos de terceros diseñados para configurar de manera segura las conexiones de FTP.

  • AWS Import/Export: si tiene que transferir enormes volúmenes de datos a Amazon, quizá resulte más rápido o económico enviarlos a Amazon en un dispositivo de almacenamiento portátil y pagar a Amazon por cargarlos directamente en S3. Amazon ofrece este servicio con el nombre de AWS Import/Export.

    Si está considerando utilizar el servicio AWS Import/Export, tendrá que decidir si ello se ajusta a las normas de seguridad de datos de su organización. Cada vez que envía un dispositivo por correo, existe el riesgo (por más pequeño que sea) de que resulte físicamente destruido o de que los datos sean interceptados. Estos riesgos pueden mitigarse haciendo una copia de seguridad de los datos y cifrándolos. No obstante, si todavía duda sobre si AWS Import/Export es una opción adecuada, consulte directamente a Amazon.

Amazon trabaja con numerosos proveedores de soluciones, algunos de los cuales ofrecen servicios de transferencia, almacenamiento y protección de datos. Consulte en Encuentre un proveedor de soluciones de AWS si alguna de esas empresas puede ayudarle en la implementación de su estrategia en la nube. Esri es uno de esos proveedores y dispone de varios servicios de proyectos e implementación para implementar SIG en la nube de Amazon.

Factores que afectan al tiempo de transferencia de los datos

Los resultados de las opciones de transferencia de datos expuestas pueden variar en función de la proximidad física a la nube de Amazon, la hora del día y la calidad de la conexión a Internet.

Los conjuntos de datos SIG, en especial las imágenes y cachés de mapas, pueden ocupar gran cantidad de espacio y puede ser necesario comprimirlos antes de transferirlos, ya sea para reducir el tamaño de los archivos o el número total de archivos, con el fin de que la transferencia resulte más eficiente (en especial, en el caso de las cachés de mapas). Algunas utilidades de cliente de S3 limitan el tamaño de archivos que pueden transferirse o el número de archivos individuales que pueden almacenarse. También algunos programas de compresión limitan el volumen de datos que pueden comprimirse. Asimismo, deberá tener en cuenta el tiempo y el esfuerzo que se requieren para la operación de comprimir a la hora de seleccionar la opción de transferencia de datos de su preferencia.

Por último, si se utiliza S3, tenga en cuenta las limitaciones en cuanto al número de paquetes que podrá crear y otras restricciones aplicables a paquetes en S3. Amazon los enumera en Restricciones y limitaciones de paquetes.

Mantenimiento de la integridad de las rutas de datos

Cada vez que los datos se mueven a una nueva ubicación, es necesario tener en cuenta la necesidad de actualizar las rutas que hacen referencia a los datos. Se trata de algo especialmente complejo con los documentos cartográficos, con referencias a decenas de capas de datos en diferentes rutas.

El registro de la ubicación de datos de Amazon EC2 en ArcGIS Server puede ayudar a reducir el esfuerzo de recomponer rutas de datos rotas después de la publicación. Consulte Registro de datos con ArcGIS Server utilizando ArcGIS for Desktop.

Otra opción consiste en iniciar sesión en su instancia y usar ArcMap para reparar las rutas desactualizadas. ArcGIS for Desktop está incluido en la AMI de ArcGIS Server para poder realizar las reparaciones con facilidad.

Otro método para reducir la necesidad de reparar las conexiones de datos es utilizar rutas relativas en los documentos cartográficos, y guardar los mapas y datos en una carpeta común.