Motor de búsqueda para escritorios Linux

Los discos duros de los PCs convencionales cada vez son más grandes, lo que permite almacenar un número mayor de ficheros y más grandes. Esto está bien, pero tanta información debe estar bien categorizada y ordenada para que a la hora de buscar un fichero concreto no nos volvamos locos buscando.
¿Dónde habré metido aquel pdf con la tabla de categorias profesionales de mi empresa? A saber donde está el documento Word que me envió fulanito y que necesito ahora.

Por esto, cada vez son más comunes los motores de búsqueda para tu ordenador como, por ejemplo, el Google Desktop o el Beagle.

En las siguientes líneas veremos uno motor nuevo, destinado a escritorio Linux, que se caracteriza por ser ligero, bastante simple de usar, potente y de código abierto. Este motor de búsqueda es Recoll.

Como decíamos, Recoll es un motor de búsqueda para escritorios Linux, que parece bastante simple pero que demuestra ser bastante potente y altamente configurable. Está basado en Xapian, una librería de código abierto bastante madura para generación de motores de búsqueda, la versión actual es la 1.8.1 y tiene licencia GPL por lo que es libre.

Puede indexar varios tipos de ficheros de forma nativa (html, OpenOffice.org, emails de Thunderbird y Evolution, Lyx, Scribus), así como otros gracias a gestores externos (pdf, excel, word, etc.).

La configuración del motor se hace modo manual puesto que no existe una interfaz gráfica a tal efecto (el buscador en sí presentan una interfaz gráfica con QT). Sin embargo, la primera vez se genera una configuración básica que cubre casi todos los fundamentos necesarios del buscador, con lo que es posible que no la tengas que tocar. De todas formas es fácil de configurar y ofrece muchos parámetros para optimizar tu configuración. Sólo hay que seguir el manual de usuario y ya está.

Como todo motor de búsqueda, es necesario indexar los ficheros del disco duro para poder buscarlos luego. Recoll hace una primera indexación al instalar el producto, lo cual puede llevar un tiempo. Además, permite varios modos de regenerar el índice más adelante. Se puede hacer en modo manual ejecutando el comando recollindex. También se puede actualizar mediante un cron que ejecute el comando anterior de forma programada. Finalmente se puede ejecutar en modo daemon con el comando recollindex -m. Estos ficheros, por defecto se indexan en el home directory, pero se puede configurar para elegir otro directorio donde almacenar el índice.

Recoll ofrece un amplio abanico de formas de buscar ficheros en tu ordenador. Puedes buscar una o todas las palabras introducidas en la caja de búsquedas, por nombres de ficheros, apoyándote en comodines y en operadores booleanos. Si usas la búsqueda avanzada, puedes buscar por proximidad, con términos de búsqueda ilimitados, con comodines y con operadores booleanos.

Resultados de búsqueda

Los resultados de la búsqueda se muestran en la pantalla principal de Recoll, y para cada entrada encontrada muestra el icono del tipo de fichero, la relevancia, el contexto, un enlace para previsualizar el fichero, y un enlace para editar el fichero.

Recoll además te da una utilidad llamada Term Explorer Tool, mediante la cual puedes buscar términos de búsqueda ya usados que ahora mismo no recuerdas bién como se escriben. Es como un mini buscador dentro del índice de ficheros que te muestra términos de búsqueda próximos a lo que pongas tú.

Term Explorer Tool

A continuación puedes ver la lista de características de Recoll.

Características:

  • Fácil instalación, pocas dependencias. No es necesaria una base de datos, servidor web, un entorno de escritorio ni nada raro..
  • Funciona en la mayoría de sistemas basados en UNIX.
  • GUI basada en QT.
  • Soporta los tipos de documentos más comunes.
  • Potentes medios para hacer consultas, con búsquedas booleanas, frases, proximidad, comodines, filtros de tipos de ficheros y en directorios.
  • Diferentes codificaciones de conjuntos de caracteres con base interna en Unicode.
  • Múltiples bases de datos seleccionables.
  • Normalización (reducción a la raíz semántica) de palabras en tiempo de consulta (se puede cambiar el idioma después de indexar).

Fuentes: Linux.com y Recoll.

Valora esta noticia: 1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (0 votos, media: 0,00 de 5)
Loading ... Loading ...