Skip To Content

Componentes de la publicación

En este tema

Componentes de la publicación

El almacén de datos principal para los documentos de metadatos catalogados es un sistema de administración de bases de datos relacionales. Vea el tema del geoportal Preinstalación para obtener una lista de los sistemas de bases de datos compatibles. La base de datos relacional incluye tablas asociadas con: el estado de aprobación del recurso, método de publicación y atributos de identificación adicionales. También incluye tablas para usuarios a los que se hace referencia (usuarios que poseen datos dentro del catálogo), repositorios remotos registrados para la sincronización y búsquedas grabadas por el usuario. El Geoportal usará el API JDBC de Java estándar cuando se comunique directamente con la base de datos relacional. Los componentes principales asociados con la publicación de los documentos en el catálogo de metadatos del Geoportal se muestran en la figura a continuación.

Los documentos de metadatos que el administrador clasifique ya sea como "Aprobados" o "Revisados" se enviarán al Índice Apache Lucene que usa el Geoportal. Los documentos almacenados dentro del índice se pueden descubrir a través de la búsqueda. Apache Lucene implementa un Analizador durante el proceso de indexación (y búsqueda). El trabajo del Analizador es acortar términos, considerando el lenguaje con base en palabras irrelevantes y lematización. Los Analizadores adicionales están disponibles a través de la comunidad de contribución Apache Lucene. El sitio Web tiene dos páginas que exponen los puntos finales de la publicación de metadatos:

  • Una página para cargar que le brinda a un publicador la capacidad de cargar documentos de metadatos desde un disco duro o desde un punto final HTTP
  • Una página de edición en línea que le brinda a un publicador la capacidad de crear y editar documentos de metadatos. Únicamente estos documentos que han sido creados por el editor en línea están disponibles para una edición posterior.
El sitio Web incluye un proceso de sincronización que permite la publicación de documentos de recursos desde catálogos externos. El diagrama a continuación muestra los componentes del sincronizador en una forma más detallada.

Dentro del proceso de sincronización el programador asigna los recursos registrados a la cola para la sincronización. El watchdog se utiliza únicamente en un entorno de equilibrio de carga para garantizar que los procesos de sincronización estén coordinados. Una vez que la cola recibe información del recurso, ésta adquiere la información de la conexión del recurso a través del elemento de definición de recursos y procede por medio de un subproceso de sincronización dedicado. Los documentos de recursos se seleccionan del catálogo objetivo o se crea con base en la información de recursos disponible. La salida de la selección, la iteración y el proceso de lectura es un documento xml que se enviará a través del componente de solicitud de publicación que se describe a continuación. El subproceso de sincronización dedicado también crea un informe que es visible a través de la interfaz de usuario del Geoportal en la página de Informe de sincronización del recurso. Como una opción en la página Crear o Editar recursos puede elegir recibir un correo electrónico de los resultados enviados de la sincronización.

El sitio Web también expone un API de REST, lo que permite la publicación compatible de los documentos de metadatos desde las aplicaciones del cliente como ArcCatalog. El Publicar cliente de Geoportal es un plug-in para ArcCatalog que publica los documentos de metadatos en lote (desde las carpetas o GeoDatabases) por medio de este punto final.

Cada solicitud de publicación implementa una metodología estandarizada para procesar un documento de metadatos XML:

  1. Interrogación: El documento será interrogado para determinar su estándar asociado de metadatos
  2. Evaluación: Se evaluará el documento de acuerdo con el archivo de configuración asociado con el estándar. La evaluación determina los parámetros principales de interés (como el título, abstracción, …)
  3. Validación: Se hará la validación del documento de acuerdo con el archivo de configuración asociado con el estándar. Si el estándar tiene un XSD asociado (Definición del esquema XML), se validará el documento contra el XSD.
  4. Identificación: Se hace una determinación en cuanto a si el documento existe o no en la actualidad dentro del catálogo. Este paso es necesario para evitar la duplicación y depende del contenido del documento (algunos tienen identificadores internos) y del método de publicación (algunos métodos pueden proporcionar un URI único asociado con el origen).
  5. Almacenar el documento: El documento se envía a la base de datos relacional para almacenarlo.
  6. Actualizar atributos administrativos: Los atributos administrativos dentro de la base de datos relacional se actualizan a través del API JDBC de Java. Esto incluye: el método de publicación, un identificador interno del archivo si está disponible, un URI asociado con el origen, si está disponible.
  7. Indexar si es necesario: Si un administrador ha aprobado o revisado previamente el documento (o cuando se apruebe o revise), se envía el documento al Índice Apache Lucene. Este paso usa una clase del Geoportal (LuceneIndexAdapter) para comunicarse con el índice a través del API de Java de Apache Lucene.