Skip To Content

Usar consultas de texto de búsqueda Lucene

En este tema

Usar consultas de texto de búsqueda Lucene

El Geoportal usa un sofisticado motor de búsqueda que proporciona varias opciones de búsqueda, opciones de clasificación, rendimiento rápido y extensibilidad. El motor de búsqueda se basa en el motor de búsqueda de origen abierto Apache Lucene. Para aprovechar al máximo la página de búsqueda del Geoportal, tome en cuenta las siguientes entidades que proporciona Lucene para la sintaxis de búsqueda:

  1. Términos

    Una consulta se descompone en términos y operadores. Hay dos tipos de términos: Términos individualesy Frases. Un Término individual es una palabra individual como air o quality. Una Frase es un grupo de palabras encerradas por comillas dobles como "air quality". Se pueden combinar varios términos juntos con operadores booleanos para formar una consulta más compleja. Ejemplos:

    • Si busca air puede obtener un resultado de 35 accesos (elementos que incluyen la palabra air)
    • Si busca quality puede obtener un resultado de 123 visitas (elementos que incluyen la palabra quality)
    • Si busca air quality (sin comillas) puede obtener un resultado de 148 visitas (elementos que incluyen las palabras air o quality o ambas)
    • Si busca air AND quality obtendrá un resultado de 10 visitas (elementos que incluyen ambas palabras air y quality)
    • Si busca "air quality" (con comillas) puede obtener un resultado de 7 visitas (elementos que incluyen las palabras air y quality directamente una después de la otra)
    • Si busca title:air puede obtener un resultado de 5 accesos (elementos que incluyen la palabra airen el título)
    • Si busca title:quality puede obtener un resultado de 14 accesos (elementos que incluyen la palabra qualityen el título)
    • Si busca +title:air+title:quality o title:"air quality" puede obtener un resultado de 2 visitas (ambos elementos incluyen las dos palabras air y quality en el título)

  2. Caracteres especiales

    El Geoportal es compatible con caracteres especiales separados que son parte de la sintaxis de la consulta. La lista actual de caracteres especiales son + - && || ! ( ) { } [ ] ^ " ~ * ? : \ Para separar estos caracteres use el \ antes del carácter. Por ejemplo para buscar elementos que incluyan la visita de la escala 1:250k use la consulta: \1\:250k.

  3. Campos

    Lucene es compatible con los datos de campos. Cuando realiza una búsqueda, puede especificar un campo o usar el campo predeterminado. Los nombres de los campos y el campo predeterminado son de implementación específica. Puede buscar cualquier campo escribiendo el nombre de campo seguido por dos puntos y luego el término que busca. Buscar un campo específico en la consulta puede ser más exacto que solo buscar con términos. Tome en cuenta que algunos campos distinguen entre mayúsculas y minúsculas. Recuerde que ciertos caracteres especiales se deben separar en la consulta usando un carácter de barra invertida (\) o encerrarlos entre comillas ("") cada vez que sean parte de un texto que desee buscar. Ejemplos:

    • título:"El camino correcto" AND texto:"no siga por aquí"
    • uuid:"{550E8400-E29B-41D4-A716-446655440000}"
    • uuid:\{550E8400\-E29B\-41D4\-A716\-446655440000\}
    • resource.url:"http://server.arcgisonline.com/ArcGIS/rest/services/ESRI_StreetMap_World_2D/MapServer"
    Nota:

    El campo únicamente es válido para el término al que precede directamente, de forma que la consulta título:Hágalo bien únicamente encontrará "Hágalo" en el campo del título.

  4. Búsquedas con comodines

    El Geoportal es compatible con búsquedas con comodines de varios caracteres o individuales dentro de términos individuales (no dentro de consultas de frases).

    Precaución:

    No puede usar un símbolo de * o ? como el primer carácter de una búsqueda.

    • Para ejecutar una búsqueda de comodín de carácter individual use el símbolo "?". La búsqueda del comodín de carácter individual busca los términos que coinciden con el carácter individual que se reemplazó. Por ejemplo, para buscar text o test puede usar la búsqueda:te?t
    • Para ejecutar una búsqueda de comodín de varios caracteres use el símbolo "*". Las búsquedas con comodines de varios caracteres buscan 0 o más caracteres. Por ejemplo, para buscar test, tests o tester puede usar la búsqueda: test* . También puede usar las búsquedas con comodines de caracteres a la mitad de un término: te*t
  5. Búsquedas difusas

    El Geoportal es compatible con las búsquedas difusas que se basan en la Distancia de Levenshtein o en el algoritmo de Distancia de edición. Para hacer una búsqueda difusa use el símbolo de la tilde, "~", al final de un Término individual. Por ejemplo, para buscar un término similar en ortografía para air use la búsqueda difusa: air~. Esta búsqueda no solo encontrará elementos que contienen términos como air y airplane, sino tambiénaid. El Geoportal admite especificar la similitud requerida. El valor está entre 0 y 1, con un valor más cercano a 1 únicamente coincidirán los términos con una similitud más alta. Por ejemplo: air~0.8 El valor predeterminado que se usa si no se proporciona un parámetro es 0.5.

  6. Búsquedas de proximidad

    El Geoportal admite encontrar palabras que están dentro de una distancia específica. Para hacer una búsqueda de proximidad use el símbolo de la tilde, "~", al final de una Frase. Por ejemplo para buscar air y quality dentro de 10 palabra de cada uno en un documento, use la búsqueda: air quality"~10

  7. Búsquedas de rango

    El Geoportal es compatible con consultas de rango para sobre y marca de hora. Esto permite que el usuario relacione documentos cuyos valores de campos están entre el límite inferior y superior que especifica la Consulta de rango. Las Consultas de rango pueden incluir o excluir los límites superiores o inferiores.

    • Ejemplos de sobre:
      • sobre:[-80,-70 A +30,+70] Está búsqueda daría como resultado que se devolvieran documentos que intersecan un sobre espacial con una coordenada del límite Suroeste de -80° O y -70° S y una coordenada del límite Noreste de 30° O y 70° N.
      • sobre:{-80,-70 A +30,+70}Esta búsqueda daría como resultado que se devolvieran documentos que entran exactamente dentro del rango de un sobre espacial con una coordenada del límite Suroeste -80° O y -70° S y una coordenada del límite Noreste de 30° O y 70° N.
      Nota:

      La sintaxis aquí es importante. Es el nombre de campo (sobre) seguido por dos puntos (:) y luego o una definición de rango inclusivo o una definición de rango exclusivo. Para la búsqueda inclusiva se usan los corchetes cuadrados ([ ]) y para la búsqueda exclusiva se usan los corchetes curvos ({ }). La diferencia es que las búsquedas de rango exclusivo seleccionarán únicamente aquellos recursos en los que el sobre entra exactamente dentro del rango especificado, mientras que una búsqueda de rango inclusivo seleccionará los recursos que intersecan el rango especificado pero que también se salen. El primer par de valores son las coordenadas de la esquina inferior izquierda seguida por la palabra clave A (en mayúsculas), luego las coordenadas de la esquina superior derecha. Las coordenadas siempre se dan en el sistema de proyección WGS 1984 (4236). Los comodines también se pueden usar en el lugar de una coordenada simple o un par completo de coordenadas de esquina, por ejemplo sobre:[*,-70 A +30,*] o sobre:{-80,-70 A *}

    • Ejemplos de la marca de hora:
      • dateModified:[2009-10-11 A 2009-11-10]
      • dateModified:[2006 A 2010]
      • dateModified:2009-12
      Para la sintaxis de la marca de hora, el nombre de campo especificado es dateModified seguido por dos puntos y luego una definición de rango inclusivo. El primer ejemplo seleccionará recursos con dateModified entre 2009-10-11 a 2009-11-10 incluyendo estos rangos de fechas. El segundo ejemplo seleccionará recursos con dateModified desde el año 2006 al 2010. El último ejemplo seleccionará recursos con dateModified en diciembre de 2009 (no necesita corchetes).
  8. Amplificar un término

    El Geoportal proporciona el nivel de importancia de los documentos que coinciden con base en los términos encontrados. Para amplificar un término use acento circunflejo, ^, símbolo con factor de amplificación (un número) al final del término que busca. Cuanto más grande sea el factor de amplificación, más relevante será el término. La amplificación le permite controlar la importancia de un documento al amplificar su término. Por ejemplo, si busca air quality y desea que el término air sea más importante, amplifíquelo usando el símbolo ^ junto con el factor de amplificación al lado del término. Escribiría: air^4 quality. Esto hará que los documentos con el término air aparezcan con más importancia. También puede amplificar Términos de frases como en el ejemplo: "air quality"^4 "water quality". Por predeterminación, el factor de amplificación es 1. Aunque el factor de amplificación debe ser positivo, puede ser menor que 1 (por ejemplo 0.2)

  9. Operadores booleanos

    Los operadores booleanos permiten que se combinen los términos a través de operadores lógicos. El Geoportal es compatible con AND, +, OR, NOT y - como operadores booleanos.

    Nota:

    Los operadores booleanos deben estar TODOS EN MAYÚSCULA

    • El operador OR es el operador de conjunción predeterminado. Esto quiere decir que si no hay un operador booleano entre dos términos, se utiliza el operador OR. El operador OR vincula dos términos y encuentra un documento que coinciden en caso de que alguno de los términos exista en un documento. Esto es equivalente a una combinación por medio del uso de conjuntos. El símbolo n|| se puede usar en lugar de la palabra OR.
    • El operador AND coincide con documentos en donde ambos términos existen en algún lugar del texto en un documento individual. Esto es equivalente a una intersección por medio del uso de conjuntos. El símbolo && se puede usar en lugar de la palabra AND.
    • El + o el operador necesario requiere que el término después del símbolo + esté en algún lugar en un campo de un documento individual.
    • El operador NOT excluye documentos que incluyen el término después de NOT. Esto es equivalente a una diferencia por medio del uso de conjuntos. El símbolo ! se puede usar en lugar de la palabra NOT.
      Nota:

      El operador NOT, no se puede usar con un solo término.

  10. Agrupación

    El Geoportal es compatible con el uso de paréntesis para agrupar cláusulas para formar sub consultas. Esto puede ser muy útil si desea controlar la lógica booleana para una consulta. Por ejemplo: (air OR water) AND quality encontrarán documentos que incluyen las palabras air y quality o las palabras water y quality.

  11. Agrupación de campos

    El Geoportal es compatible con el uso de paréntesis para agrupar varias cláusulas en un campo individual. Por ejemplo: title:(air OR water) encuentra elementos que incluyen las palabras air o water en el título.

Para obtener más información sobre cómo aprovechar específicamente la sintaxis de búsqueda de Lucene para hacer búsquedas poderosas en el Geoportal, consulte el sitio Web de Lucene.