Uma ferramenta para expansão do vocabulário com base em coocorrência.

Neste trabalho é apresentado um módulo desenvolvido para a experimentação de algumas técnicas de pré-processamento visando uma boa representação de coleções de documentos. As técnicas experimentadas são voltadas à expansão de vocabulário do domínio por meio da inclusão de termos coocorrentes. Um módulo, chamado DATool, foi desenvolvido em Java e experimentos estão sendo realizados. Caso os resultados sejam positivos, as técnicas serão transformadas em filtros de pré-processamento e indexação a serem incorporados ao arcabouço de ferramentas do projeto CRITIC@.

Saved in:
Bibliographic Details
Main Authors: SILVA JÚNIOR, E. L., SINOARA, R. A., REZENDE, S. O., MARCACINI, R. M., MOURA, M. F.
Other Authors: EXUPÉRIO LÉDO SILVA JÚNIOR, ICMC-USP; ROBERTA AKEMI SINOARA, ICMC-USP; SOLANGE OLIVEIRA REZENDE, ICMC/USP; RICARDO MARCONDES MARCACINI, UFMS; MARIA FERNANDA MOURA, CNPTIA.
Format: Anais e Proceedings de eventos biblioteca
Language:pt_BR
por
Published: 2016-02-25
Subjects:Mineração de textos, Pré-processamento de textos, Coocorrência de termos, Text mining,
Online Access:http://www.alice.cnptia.embrapa.br/alice/handle/doc/1038676
Tags: Add Tag
No Tags, Be the first to tag this record!