Uma ferramenta para expansão do vocabulário com base em coocorrência.
Neste trabalho é apresentado um módulo desenvolvido para a experimentação de algumas técnicas de pré-processamento visando uma boa representação de coleções de documentos. As técnicas experimentadas são voltadas à expansão de vocabulário do domínio por meio da inclusão de termos coocorrentes. Um módulo, chamado DATool, foi desenvolvido em Java e experimentos estão sendo realizados. Caso os resultados sejam positivos, as técnicas serão transformadas em filtros de pré-processamento e indexação a serem incorporados ao arcabouço de ferramentas do projeto CRITIC@.
Main Authors: | , , , , |
---|---|
Other Authors: | |
Format: | Anais e Proceedings de eventos biblioteca |
Language: | pt_BR por |
Published: |
2016-02-25
|
Subjects: | Mineração de textos, Pré-processamento de textos, Coocorrência de termos, Text mining, |
Online Access: | http://www.alice.cnptia.embrapa.br/alice/handle/doc/1038676 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | Neste trabalho é apresentado um módulo desenvolvido para a experimentação de algumas técnicas de pré-processamento visando uma boa representação de coleções de documentos. As técnicas experimentadas são voltadas à expansão de vocabulário do domínio por meio da inclusão de termos coocorrentes. Um módulo, chamado DATool, foi desenvolvido em Java e experimentos estão sendo realizados. Caso os resultados sejam positivos, as técnicas serão transformadas em filtros de pré-processamento e indexação a serem incorporados ao arcabouço de ferramentas do projeto CRITIC@. |
---|