Jul 122014
 

En el motor de búsquedas solr, una colección es un conjunto de documentos que comparten una misma estructura.

El paquete de instalación de solr incluye una colección de ejemplo «collection1». En los casos más sencillos, bastará con realizar algunas modificaciones en la configuración de esta colección. Pero en otros casos, puede ser conveniente crear colecciones diferenciadas para los distintos tipos de documentos a indexar. En este artículo se presenta el procedimiento para crear una nueva colección en solr.

Crear los ficheros de configuración de la colección

En la instalación por defecto, los ficheros de configuración de la colección «collection1» se encuentran en el directorio «example/solr/collection1».

Para crear una nueva colección «micoleccion», comenzamos por crear al mismo nivel que «collection1» un nuevo directorio, con dos subdirectorios «conf» y «data».

Crearemos también un fichero «core.properties», que simplemente contiene el nombre de la colección.

Por último, copiaremos en el subdirectorio «micoleccion/conf» los dos ficheros de configuración «solrconfig.xml» y «schema.xml».

Nota: En el directorio collection1/conf, existen otros ficheros de configuración: «spellings.txt», «stopwords.txt», «currency.xml»,… Estos ficheros son referenciados en las definiciones de los tipos de datos existentes en el fichero «schema.xml» de ejemplo. Si mantenemos dichas definiciones en el fichero «schema.xml» de la nueva colección, deberemos copiar también dichos ficheros a micoleccion/conf.

Editar el fichero schema.xml

El fichero schema.xml contiene las definiciones de los tipos de datos, y las definiciones de los campos que pueden existir en los documentos de la colección.

Deberemos editar el fichero, y añadir, modificar o eliminar las definiciones para adaptarlas al tipo de documentos que va a contener la colección.

Normalmente, nos interesará mantener los tipos primitivos: string,boolean,int,float,date,…

También, para poder realizar búsquedas «full-text», conviene mantener la definición del tipo «text_general», y una o varias definiciones de campos de tipo texto específicas para distintos idiomas, por ejemplo «text_en» para inglés, o «text_es» para español.

Por último, sustituimos las definiciones de campos de ejemplo por las definiciones de campos correspondientes a la estructura de los documentos que va a contener la colección.

Referencias

Indice de artículos relacionados con solr

 Publicado por en 9:33 am

 Deja un comentario

(requerido)

(requerido)