Plugins do Elasticsearch para tratamento de termos compostos e correção do filtro de sinônimos.

Sistemas de recuperação de informação são fundamentais para qualquer organização que trabalhe com o uso e a produção de conhecimento de forma intensiva. As demandas por informações de qualidade são, cada vez mais, desafiadoras e importantes para as tomadas de decisão. Neste contexto, os sistemas de recuperação de informação precisam ser constantemente aperfeiçoados.Na Empresa Brasileira de Pesquisa Agropecuária (Embrapa), diversos sistemas possibilitam a recuperação de informação. Ainfo, Banco de Dados da Pesquisa Agropecuária (BDPA), Sabiia e Alice possibilitam o acesso à relevante produção técnico-científica da agropecuária. Vários outros sistemas e sites da empresa, como Quaesta, portal e intranet, também apresentam mecanismos de busca que facilitam a recuperação de informação. Porém, dada a rápida evolução da ciência da computação e das tecnologias geradas neste campo do conhecimento, é essencial a atualização constante dos profissionais desta área e a incorporação das novas ferramentas e metodologias nas tecnologias da Embrapa. Elasticsearch é uma destas ferramentas que despontam gerando grande impacto nas organizações e que rapidamente são incorporadas por elas. Utilizada para a construção de mecanismos de busca em textos e em dados estruturados e para análises detalhadas, esta tecnologia vem sendo amplamente empregada para tratar grandes volumes de dados. É muito comum que soluções computacionais não atendam por completo as demandas específicas dos usuários. Porém, Elasticsearch é software livre e os profissionais podem conhecê-lo em profundidade para resolver seus próprios problemas e, quando possível, retornar para a comunidade os avanços alcançados. Este trabalho representa uma contribuição para a comunidade que utiliza Elasticsearch e também para as equipes técnicas responsáveis pelo desenvolvimento dos sistemas de recuperação da informação da Embrapa.

Saved in:
Bibliographic Details
Main Author: VAZ, G. J.
Other Authors: GLAUBER JOSÉ VAZ, CNPTIA.
Format: Folhetos biblioteca
Language:pt_BR
por
Published: 2016
Subjects:Elasticsearch, Sistema de recuperação da informação, Sinônimos, Termos compostos, Tecnologia da informação, Information technology, Information retrieval,
Online Access:http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1064186
Tags: Add Tag
No Tags, Be the first to tag this record!