Uso de sintagmas nominais na classificação automática de documentos eletrônicos

Esta pesquisa verificou se ocorre aprimoramento na classificação de documentos eletrônicos com o uso de técnicas e algoritmos de mineração de texto (análise de texto) utilizando-se, além das palavras, sintagmas nominais como indexadores. Utilizaram-se duas ferramentas nos experimentos propostos desta pesquisa o OGMA e a WEKA. O OGMA foi desenvolvido pelos autores para automatizar a extração dos sintagmas nominas e o cálculo do peso de cada termo na indexação dos documentos para cada um dos seis métodos propostos. A WEKA foi utilizada para analisar os resultados encontrados pelo OGMA utilizando aos algoritmos de agrupamento e classificação, SimpleKMeans e NaiveBayes, respectivamente, obtendo um valor percentual indicando quantos documentos foram classificados corretamente. Os métodos com melhores resultados foram o de termos sem stopwords e o de sintagmas nominais classificados e pontuados como descritores.

Saved in:
Bibliographic Details
Main Authors: Maia,Luiz Cláudio, Souza,Renato Rocha
Format: Digital revista
Language:Portuguese
Published: Escola de Ciência da Informação da UFMG 2010
Online Access:http://old.scielo.br/scielo.php?script=sci_arttext&pid=S1413-99362010000100009
Tags: Add Tag
No Tags, Be the first to tag this record!