Skip To Content

Usar consultas de texto de búsqueda de Lucene

Usar consultas de texto de búsqueda de Lucene

El Geoportal usa un sofisticado motor de búsqueda que proporciona varias opciones de búsqueda, opciones de clasificación, rendimiento rápido y extensibilidad, y que se basa en el motor de búsqueda de código abierto Lucene de Apache. Para aprovechar al máximo la página de búsqueda del Geoportal, tome en cuenta las siguientes entidades que proporciona Lucene para la sintaxis de búsqueda:

  1. Términos

    Una consulta se divide en términos y operadores. Hay dos tipos de términos: términos sencillos y frases. Un término sencillo es una sola palabra, como contaminación o atmosférica. Una frase es un grupo de palabras entre comillas, como "contaminación atmosférica". Se pueden combinar varios términos juntos con operadores booleanos para formar una consulta más compleja. Ejemplos:

    • Al buscar la palabra contaminación, se obtienen 35 resultados (elementos que contienen la palabra contaminación).
    • Al buscar atmosférica, se obtienen 123 resultados (elementos que contienen la palabra atmosférica).
    • Al buscar contaminación atmosférica (entre comillas), se obtienen 148 resultados (elementos que contienen las palabras contaminación o atmosférica, o ambas).
    • Al buscar contaminación AND atmosférica, se obtienen 10 resultados (elementos que contienen ambas palabras: contaminación y atmosférica).
    • Al buscar "contaminación atmosférica" (entre comillas), se obtienen 7 resultados (elementos que contienen las palabras contaminación y atmosférica una justo detrás de la otra).
    • Al buscar title:contaminación, se obtienen 5 resultados (elementos que contienen la palabra contaminación en el título).
    • Al buscar title:atmosférica, se obtienen 14 resultados (elementos que contienen la palabra atmosférica en el título).
    • Al buscar +title:contaminación +title:atmosférica o title:"contaminación atmosférica", se obtienen 2 resultados (ambos elementos contienen las dos palabras: contaminación y atmosférica en el título).

  2. Caracteres especiales

    El Geoportal es compatible con caracteres especiales separados que son parte de la sintaxis de la consulta. Actualmente, se pueden usar estos caracteres especiales: + - && || ! ( ) { } [ ] ^ " ~ * ? : \ Si quiere escribir realmente uno de estos caracteres, inserte una barra inclinada (\) delante de él. Por ejemplo, para buscar elementos a escala 1:250.000, use la consulta: \1\:250.000.

  3. Campos

    Lucene es compatible con los datos de campos. Cuando realiza una búsqueda, puede especificar un campo o usar el campo predeterminado. Los nombres de los campos y el campo predeterminado son de implementación específica. Puede buscar cualquier campo escribiendo el nombre de campo seguido por dos puntos y luego el término que busca. Buscar un campo específico en la consulta puede ser más exacto que solo buscar con términos. Tome en cuenta que algunos campos distinguen entre mayúsculas y minúsculas. Recuerde que ciertos caracteres especiales se deben separar en la consulta usando un carácter de barra invertida (\) o encerrarlos entre comillas ("") cada vez que sean parte de un texto que desee buscar. Ejemplos:

    • title:"El camino correcto" AND text:"no seguir por aquí"
    • uuid:"{550E8400-E29B-41D4-A716-446655440000}"
    • uuid:\{550E8400\-E29B\-41D4\-A716\-446655440000\}
    • resource.url:"http://server.arcgisonline.com/ArcGIS/rest/services/ESRI_StreetMap_World_2D/MapServer"
    Nota:

    El campo solo es válido para el término al que precede directamente, por lo que la consulta title:Hágalo bien solo buscará "Hágalo" en el campo de búsqueda.

  4. Búsquedas con caracteres comodín

    El Geoportal es compatible con búsquedas con comodines de varios caracteres o individuales dentro de términos individuales (no dentro de consultas de frases).

    Precaución:

    No se pueden usar los símbolos * ni ? como el primer carácter de una búsqueda.

    • Para ejecutar una búsqueda de comodín de un solo carácter use el símbolo "?". La búsqueda del comodín de carácter individual busca los términos que coinciden con el carácter individual que se reemplazó. Por ejemplo, para buscar text o test, puede usar la búsqueda:te?t
    • Para ejecutar una búsqueda de comodín de varios caracteres use el símbolo "*". Las búsquedas con comodines de varios caracteres buscan 0 o más caracteres. Por ejemplo, para buscar test, tests o tester, puede usar la búsqueda: test* . También puede usar los comodines en medio de un término: te*t
  5. Búsquedas aproximadas

    El Geoportal es compatible con las búsquedas aproximadas que se basan en la Distancia de Levenshtein o en el algoritmo de Distancia de edición. Para hacer una búsqueda aproximada, use el símbolo "~" (tilde) al final de un término sencillo. Por ejemplo, para buscar un término que se escriba de forma parecida a casa, use la búsqueda aproximada: casa~. Esta búsqueda encontrará elementos que contengan palabras como casa y casaca y, además, caso. El Geoportal admite especificar la similitud requerida. El valor está entre 0 y 1, con un valor más cercano a 1 únicamente coincidirán los términos con una similitud más alta. Por ejemplo: casa~0,8 El valor predeterminado que se usa si no se indica el parámetro es 0,5.

  6. Búsquedas por proximidad

    El Geoportal admite encontrar palabras que están dentro de una distancia específica. Para hacer una búsqueda por proximidad, use el símbolo "~" (tilde) al final de una frase. Por ejemplo, para buscar contaminación y atmosférica en una distancia no superior a 10 palabras una respecto de la otra, use la búsqueda: "contaminación atmosférica"~10

  7. Consultas de rango

    El Geoportal es compatible con consultas de rango de delimitación y de marca de tiempo. Esto permite que el usuario relacione documentos cuyos valores de campos están entre el límite inferior y superior que especifica la Consulta de rango. Las Consultas de rango pueden incluir o excluir los límites superiores o inferiores.

    • Ejemplos de delimitación:
      • envelope:[-80,-70 TO +30,+70] Esta búsqueda devolvería los documentos en los que una delimitación espacial forma una intersección con unas coordenadas de delimitación suroeste de -80° O y -70° S y unas coordenadas de delimitación noreste de 30° O y 70° N.
      • envelope:{-80,-70 TO +30,+70} Esta búsqueda devolvería los documentos que entran exactamente dentro del rango de una delimitación espacial con unas coordenadas de delimitación suroeste de -80° O y -70° S y unas coordenadas de delimitación noreste de  30° O y 70° N.
      Nota:

      La sintaxis aquí es importante. Consta del nombre del campo (envelope) seguido de dos puntos (:) y, a continuación, una definición de rango inclusivo o exclusivo. Para la búsqueda inclusiva se usan los corchetes cuadrados ([ ]) y para la búsqueda exclusiva se usan los corchetes curvos ({ }). La diferencia es que las búsquedas de rango exclusivo seleccionarán únicamente aquellos recursos en los que la delimitación entra exactamente dentro del rango especificado, mientras que una búsqueda de rango inclusivo seleccionará los recursos que forman una intersección con el rango especificado, pero que también se salen. El primer par de valores lo forman las coordenadas de la esquina inferior izquierda seguidos de la palabra clave TO (en mayúsculas) y, después, las coordenadas de la esquina superior derecha. Las coordenadas siempre se dan en el sistema de proyección WGS 1984 (4236). También se pueden usar caracteres comodín en lugar de una sola coordenada o de un par de coordenadas de una esquina, por ejemplo, envelope:[*,-70 TO +30,*] o envelope:{-80,-70 TO *}

    • Ejemplos de marca de tiempo:
      • dateModified:[2009-10-11 TO 2009-11-10]
      • dateModified:[2006 TO 2010]
      • dateModified:2009-12
      En la sintaxis de marca de tiempo, el nombre del campo es dateModified seguido de dos puntos y una definición de rango inclusivo. En el primer ejemplo, se seleccionarán los recursos modificados entre 2009-10-11 y 2009-11-10, incluyendo estos rangos de fechas. En el segundo ejemplo, se seleccionarán los recursos que se modificaron entre el año 2006 y 2010. En el último ejemplo, se seleccionarán los recursos que se modificaron en diciembre de 2009 (no se necesitan paréntesis).
  8. Dar más importancia a un término

    El Geoportal es capaz de especificar el nivel de relevancia de los documentos devueltos con respecto a los términos encontrados. Para dar más importancia a un término, inserte el símbolo de acento circunflejo, ^, junto con un factor de relevancia (un número) al final del término que vaya a buscar. Cuanto más alto sea el factor de relevancia, más importante será el término. Esta función le permite controlar la relevancia de un documento al concederle más importancia a un término concreto. Por ejemplo, si busca contaminación atmosférica y quiere que el término contaminación sea más relevante, añada el símbolo ^ junto con el factor de relevancia. Sería algo así como: contaminación^4 atmosférica. Esto hará que los documentos con el término "contaminación" sean más relevantes. También puede dar más relevancia a toda una frase, como: "contaminación atmosférica"^4 "contaminación acústica". El factor de relevancia predeterminado es 1. Aunque este factor debe ser positivo, puede ser inferior a 1 (p. ej., 0,2)

  9. Operadores booleanos

    Los operadores booleanos permiten que se combinen los términos a través de operadores lógicos. El Geoportal admite los operadores booleanos AND, +, OR, NOT y -.

    Nota:

    Los operadores booleanos deben estar TODOS EN MAYÚSCULA.

    • El operador OR es el operador de conjunción predeterminado. Esto quiere decir que si no hay un operador booleano entre dos términos, se utiliza el operador OR. El operador OR vincula dos términos y encuentra un documento que coinciden en caso de que alguno de los términos exista en un documento. Esto es equivalente a una combinación por medio del uso de conjuntos. Se puede usar el símbolo || en lugar de la palabra OR.
    • El operador AND devuelve los documentos en los que aparecen ambos términos en cualquier parte del texto. Este operador es equivalente a una intersección usando grupos. Se puede usar el símbolo && en lugar del operador AND.
    • El símbolo + o el operador correspondiente se usan para especificar que el término introducido después del símbolo + debe aparecer en algún campo del documento.
    • El operador NOT excluye los documentos que contengan el término especificado después de NOT. Este operador es equivalente a una diferencia usando grupos. El símbolo ! se puede usar en lugar del operador NOT.
      Nota:

      El operador NOT no puede usarse con solo un término.

  10. Agrupación

    El Geoportal es compatible con el uso de paréntesis para agrupar cláusulas para formar sub consultas. Esto puede ser muy útil si desea controlar la lógica booleana para una consulta. Por ejemplo: (contaminación OR presión) AND atmosférica devolverá los documentos que contengan las palabras contaminación y atmosférica o las palabras presión y atmosférica.

  11. Agrupación de campos

    El Geoportal es compatible con el uso de paréntesis para agrupar varias cláusulas en un campo individual. Por ejemplo: title:(contaminación OR presión) devuelve los elementos que contengan las palabras contaminación o presión en el título.

Para obtener más información sobre cómo usar la sintaxis de búsqueda de Lucene para realizar búsquedas eficientes en el Geoportal, consulte el sitio web de Lucene.