FAO Home

Búsqueda AGRIS - Ayuda

Terminos
Campos
Modificadores de texto
  Búsquedas comodín
  Búsquedas difusas
  Búsquedas de proximidad
  Búsquedas de rango
  Impulso de un término
Operadores booleanos
  OR
  AND
  +
  NOT
  -
Agrupamiento
Agrupamiento de campos
Caracteres especiales de escape


 

Términos

Una consulta se desglosa en términos y operadores. Hay dos tipos de términos: términos individuales y frases.

Un término individual es una sola palabra, como “test” o “hello”.

Una frase es un grupo de palabras rodeado por comillas, como “hello dolly”.

Se pueden combinar varios términos con operadores booleanos para formar una consulta más compleja (véase más adelante).

Nota: El analizador usado para crear el índice se usará en los términos y frases de la secuencia de consultas. Por eso es importante elegir un

analizador que no interfiera con los términos usados en la secuencia de consultas.
 


 
Campos

Lucene es compatible con datos enviados. Al realizar una búsqueda puede especificar un campo o usar el campo predeterminado. La implementación

es específica para los nombres de los campos y el campo predeterminado.

Puede buscar en cualquier campo escribiendo el nombre del campo seguido de dos puntos ":" y, después, el término que está buscando.

Como ejemplo, supongamos que un índice Lucene contiene dos campos, título y texto, y que texto es el campo predeterminado. Si quiere encontrar

el documento titulado “The Right Way”, que contiene el texto “don't go this way”, puede escribir:

title:"The Right Way" AND text:go

o

title:"Do it right" AND right

Como el texto es el campo predeterminado, el indicador de campo no es necesario.

Nota: El campo sólo es válido para el término al que precede directamente, de forma que Quero

 

title:Do it right

Sólo encontrará "Do" en el campo del título. Encontrará "it" y "right" en el campo predeterminado (en este caso, el campo de texto).

 


 
Modificadores de texto

Lucene es compatible con la modificación de términos de consulta para proporcionar un amplio rango de opciones de búsqueda.

Búsquedas comodín

Lucene es compatible con búsquedas de caracteres comodín individuales y múltiples.

Para realizar una búsqueda comodín de un solo carácter, use el símbolo "?".

Para realizar una búsqueda comodín de varios caracteres, use el símbolo "*".

La búsqueda comodín de un solo carácter busca términos que coincidan con el carácter individual que se ha sustituido. Por ejemplo, para buscar

"text" o "test" puede usar la búsqueda:

 

te?t

La búsqueda comodín de varios caracteres busca 0 ó más caracteres. Por ejemplo, para buscar test, tests o tester, puede usar la búsqueda:
 

test*

También puede usar las búsquedas comodín en medio de un término.

te*t

Nota: No puede usar un símbolo * ni ? como primer carácter de una búsqueda.


 
Búsquedas difusas

Lucene es compatible con búsquedas difusas basadas en el algoritmo de la Distancia Levenshtein o en el algoritmo de Distancia de edición. Para realizar una búsqueda difusa, use el símbolo de la tilde, "~", al final de una búsqueda de una sola palabra. Pro ejemplo, para buscar un término que se deletree de forma parecida a "roam" use la búsqueda difusa:

roam~

Esta búsqueda encontrará términos como “foam” y “roams”.

 


 
Búsquedas de proximidad

Lucene es compatible con la búsqueda de palabras dentro de una distancia determinada. Para realizar una búsqueda de proximidad, use el símbolo de la tilde, "~", al final de una frase. Por ejemplo, para buscar en un documento "apache" y "jakarta" con una distancia de 10 palabras entre una y otra, use la búsqueda:
 

"jakarta apache"~10

 
Búsquedas de rango

Las búsquedas de rango permiten hacer coincidir documentos cuyos valores de campo o campos se encuentren entre la cota inferior y la cota superior especificadas por la consulta de rango. Las consultas de rango pueden ser inclusivas o exclusivas de las cotas superior e inferior. La clasificación se hace lexicográficamente.

mod_date:[20020101 TO 20030101]

Esto encontrará documentos cuyos campos mod_date tengan valores entre 20020101 y 20030101, ambos inclusive. Tenga en cuenta que las consultas de rango no están reservadas para campos de fecha. También puede usar consultas de rango con campos no de fecha:

title:{Aida TO Carmen}

Esto encontrará documentos cuyos títulos se encuentren entre Aída y Carmen, pero no incluirán ni Aída ni Carmen.

Las consultas de rango inclusivas están marcadas por corchetes cuadrados. Las consultas de rango exclusivas están marcadas con corchetes de llave.


 
Impulso de un término

Lucene proporciona el nivel de relevancia de los documentos coincidentes según los términos encontrados. Para impulsar un término, use el signo circunflejo, "^", con un factor de impulso (un número) a final del término que esté buscando. Cuanto más alto sea el factor de impulso, más relevante será el término.

El impulso le permite controlar la relevancia de un documento impulsando su término. Por ejemplo, si está buscando

jakarta apache

y quiere que el término "jakarta" tenga un impulso más relevante, use el símbolo ^ junto al factor de impulso al lado del término. Escribiría esto:

jakarta^4 apache

This Esto hará que los documentos con el término Yakarta aparezcan con más relevancia. También puede impulsar términos de frase, como en este ejemplo:

"jakarta apache"^4 "Apache Lucene"

El valor predeterminado del factor de impulso es 1. Aunque el factor de impulso debe ser positivo, puede ser inferior a 1 (por ejemplo, 0,2).


 

 


 
Operadores booleanos

Los operadores booleanos permiten que los términos se combinen mediante operadores lógicos. Lucene acepta AND, "+", OR, NOT y "-" como operadores booleanos (Nota: los operadores booleanos deben estar COMPLETAMENTE EN MAYÚSCULAS).

OR

El operador OR es el operador predeterminado de conjunciones. Esto significa que si no hay operador booleano entre dos términos, se usará el operador OR. El operador OR enlaza dos términos y encuentra un documento coincidente si uno de los dos términos se encuentra en un documento. Esto es equivalente a una unión con conjuntos. Puede usarse el símbolo || en lugar de la palabra OR.

Para buscar documentos que contengan "jakarta apache" o sólo "jakarta", use la consulta:

"jakarta apache" jakarta

o

"jakarta apache" OR jakarta

 
AND

El operador AND hace coincidir documentos en los que estén presentes los dos términos en cualquier lugar del texto de un solo documento. Esto es equivalente a una intersección con conjuntos. Se puede usar el símbolo && en lugar de la palabra AND.

Para buscar documentos que contengan "jakarta apache" y "jakarta lucene", use la consulta:

"jakarta apache" AND "Apache Lucene"

 
+

El símbolo "+" o el operador necesario exigen que el término que aparece después del símbolo "+" exista en algún lugar de un campo de un solo documento.

Para buscar documentos que deban contener "jakarta" y puedan contener "lucene", use la consulta:

+jakarta apache

 
NOT

El operador NOT excluye los documentos que contengan el término que aparece después de NOT. Esto es equivalente a una diferencia con conjuntos. Puede usarse el símbolo ! en lugar de la palabra NOT.

Para buscar documentos que contengan "jakarta apache" pero no "jakarta lucene", use la consulta:

"jakarta apache" NOT "Apache Lucene"

Nota: El operador NOT no se puede usar con sólo un término. Por ejemplo, la siguiente búsqueda no obtendría resultados:

NOT "jakarta apache"

 
-

El símbolo "-" u operador de prohibición excluye los documentos que contengan el término que aparece después del símbolo "-".

Para buscar documentos que contengan "jakarta apache", pero no "jakarta lucene", use la consulta::

"jakarta apache" -"Apache Lucene"

 

 


 
Agrupamiento

Lucene es compatible con el uso de paréntesis para agrupar cláusulas y formar sub-consultas. Esto puede resultar muy útil si quiere controlar la lógica booleana en una consulta.

Para buscar "jakarta" o "apache" y "website", use la consulta:

(jakarta OR apache) AND website

Esto elimina cualquier confusión y se asegura de que ese sitio web debe existir y de que el término jakarta o el término apache puedan existir.

 


 
Agrupamiento de campos

Lucene es compatible con el uso de paréntesis para agrupar varias cláusulas en un único campo.

Para buscar un título que contenga tanto la palabra "return" como la frase "pink panther", use la consulta:

title:(+return +"pink panther")

 


 
Caracteres especiales de escape

Lucene es compatible con caracteres especiales de escape que formen parte de la sintaxis de consulta. La lista actual de caracteres especiales es:

+ - && || ! ( ) { } [ ] ^ " ~ * ? : \

Para escapar este carácter use el símbolo \ antes del carácter. Por ejemplo, para buscar (1+1):2, use la consulta:

\(1\+1\)\:2

Copyright © 1999-2005, The Apache Software Foundation