Uma estratégia para a identificação de citações geográficas em textos técnico-científicos da área agrícola na língua portuguesa.
Resumo - A proposta deste trabalho é utilizar um reconhecedor de entidades nomeadas para a língua portuguesa, a fim de extrair metadados de citações a localizações geográficas brasileiras em publicações técnico-científicas do domínio agrícola. A estratégia adotada consistiu na identificação de padrões de citação a localidades de interesse, a partir da criação de uma coleção dourada, e a consequente personalização do reconhecedor de entidades nomeadas da biblioteca SpaCy. Os experimentos conduzidos, com os novos treinamentos da SpaCy, mostram uma revocação média de 0,92 e uma precisão média de 0,95, permitindo aceitar que a acurácia para a identificação das localidades nos textos seja bastante confiável.
Saved in:
Main Authors: | MOURA, M. F., MEDEIROS, C. M. |
---|---|
Other Authors: | MARIA FERNANDA MOURA, CNPTIA; CLARA MATTOS MEDEIROS. |
Format: | Folhetos biblioteca |
Language: | Portugues pt_BR |
Published: |
2022
|
Subjects: | Mineração de texto, Reconhecimento de entidades nomeadas, SpaCy, |
Online Access: | http://www.infoteca.cnptia.embrapa.br/infoteca/handle/doc/1150456 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Similar Items
-
Extração de citação de localidades em textos técnico-científicos em língua portuguesa.
by: MEDEIROS, C. M., et al.
Published: (2023-01-25) -
Proposta de utilização de mineração de textos para seleção, classificação e qualificação de documentos.
by: MOURA, M. F.
Published: (2004) -
Priorização de genes candidatos utilizando mineração de textos.
by: DIAS, V. F., et al.
Published: (2014-01-13) -
Desenvolvimento de uma ferramenta para análise visual de resultados mineração de textos sobre genes.
by: TOLEDO, M. dos S., et al.
Published: (2013-03-28) -
Identificação da cobertura espacial de documentos usando mineração de textos.
by: VARGAS, R. N. P., et al.
Published: (2012-11-23)