Extraction automatique de termes combinant différentes informations

Pour une communauté, la terminologie est essentielle car elle permet de décrire, échanger et récupérer les données. Dans de nombreux domaines, l'explosion du volume des données textuelles nécessite de recourir à une automatisation du processus d'extraction de la terminologie, voire son enrichissement. L'extraction automatique de termes peut s'appuyer sur des approches de traitement du langage naturel. Des méthodes prenant en compte les aspects linguistiques et statistiques proposées dans la littérature, résolvent quelques problèmes liés à l'extraction de termes tels que la faible fréquence, la complexité d'extraction de termes de plusieurs mots, ou l'effort humain pour valider les termes candidats. Dans ce contexte, nous proposons deux nouvelles mesures pour l'extraction et le "ranking" des termes formés de plusieurs mots à partir des corpus spécifiques d'un domaine. En outre, nous montrons comment l'utilisation du Web pour évaluer l'importance d'un terme candidat permet d'améliorer les résultats en terme de précision. Ces expérimentations sont réalisées sur le corpus biomédical GENIA en utilisant des mesures de la littérature telles que C-value.

Saved in:
Bibliographic Details
Main Authors: Lossio Ventura, Juan Antonio, Jonquet, Clément, Roche, Mathieu, Teisseire, Maguelonne
Format: conference_item biblioteca
Language:fre
Published: s.n.
Subjects:C30 - Documentation et information, 000 - Autres thèmes,
Online Access:http://agritrop.cirad.fr/574178/
http://agritrop.cirad.fr/574178/1/document_574178.pdf
Tags: Add Tag
No Tags, Be the first to tag this record!
id dig-cirad-fr-574178
record_format koha
spelling dig-cirad-fr-5741782022-04-15T09:18:48Z http://agritrop.cirad.fr/574178/ http://agritrop.cirad.fr/574178/ Extraction automatique de termes combinant différentes informations. Lossio Ventura Juan Antonio, Jonquet Clément, Roche Mathieu, Teisseire Maguelonne. 2014. In : Actes de la 21ème Conférence sur le Traitement automatique des langues naturelles (TALN'2014), 1-4 juillet 2014, Marseille, France. Brigitte Bigi (ed.). s.l. : s.n., 407-412. ISBN 978-2-9518233-6-5 Conférence sur le Traitement automatique des langues naturellles. 21, Marseille, France, 1 Juillet 2014/4 Juillet 2014. Researchers Extraction automatique de termes combinant différentes informations Lossio Ventura, Juan Antonio Jonquet, Clément Roche, Mathieu Teisseire, Maguelonne fre 2014 s.n. Actes de la 21ème Conférence sur le Traitement automatique des langues naturelles (TALN'2014), 1-4 juillet 2014, Marseille, France C30 - Documentation et information 000 - Autres thèmes Pour une communauté, la terminologie est essentielle car elle permet de décrire, échanger et récupérer les données. Dans de nombreux domaines, l'explosion du volume des données textuelles nécessite de recourir à une automatisation du processus d'extraction de la terminologie, voire son enrichissement. L'extraction automatique de termes peut s'appuyer sur des approches de traitement du langage naturel. Des méthodes prenant en compte les aspects linguistiques et statistiques proposées dans la littérature, résolvent quelques problèmes liés à l'extraction de termes tels que la faible fréquence, la complexité d'extraction de termes de plusieurs mots, ou l'effort humain pour valider les termes candidats. Dans ce contexte, nous proposons deux nouvelles mesures pour l'extraction et le "ranking" des termes formés de plusieurs mots à partir des corpus spécifiques d'un domaine. En outre, nous montrons comment l'utilisation du Web pour évaluer l'importance d'un terme candidat permet d'améliorer les résultats en terme de précision. Ces expérimentations sont réalisées sur le corpus biomédical GENIA en utilisant des mesures de la littérature telles que C-value. conference_item info:eu-repo/semantics/conferenceObject Conference info:eu-repo/semantics/publishedVersion http://agritrop.cirad.fr/574178/1/document_574178.pdf application/pdf Cirad license info:eu-repo/semantics/openAccess https://agritrop.cirad.fr/mention_legale.html
institution CIRAD FR
collection DSpace
country Francia
countrycode FR
component Bibliográfico
access En linea
databasecode dig-cirad-fr
tag biblioteca
region Europa del Oeste
libraryname Biblioteca del CIRAD Francia
language fre
topic C30 - Documentation et information
000 - Autres thèmes
C30 - Documentation et information
000 - Autres thèmes
spellingShingle C30 - Documentation et information
000 - Autres thèmes
C30 - Documentation et information
000 - Autres thèmes
Lossio Ventura, Juan Antonio
Jonquet, Clément
Roche, Mathieu
Teisseire, Maguelonne
Extraction automatique de termes combinant différentes informations
description Pour une communauté, la terminologie est essentielle car elle permet de décrire, échanger et récupérer les données. Dans de nombreux domaines, l'explosion du volume des données textuelles nécessite de recourir à une automatisation du processus d'extraction de la terminologie, voire son enrichissement. L'extraction automatique de termes peut s'appuyer sur des approches de traitement du langage naturel. Des méthodes prenant en compte les aspects linguistiques et statistiques proposées dans la littérature, résolvent quelques problèmes liés à l'extraction de termes tels que la faible fréquence, la complexité d'extraction de termes de plusieurs mots, ou l'effort humain pour valider les termes candidats. Dans ce contexte, nous proposons deux nouvelles mesures pour l'extraction et le "ranking" des termes formés de plusieurs mots à partir des corpus spécifiques d'un domaine. En outre, nous montrons comment l'utilisation du Web pour évaluer l'importance d'un terme candidat permet d'améliorer les résultats en terme de précision. Ces expérimentations sont réalisées sur le corpus biomédical GENIA en utilisant des mesures de la littérature telles que C-value.
format conference_item
topic_facet C30 - Documentation et information
000 - Autres thèmes
author Lossio Ventura, Juan Antonio
Jonquet, Clément
Roche, Mathieu
Teisseire, Maguelonne
author_facet Lossio Ventura, Juan Antonio
Jonquet, Clément
Roche, Mathieu
Teisseire, Maguelonne
author_sort Lossio Ventura, Juan Antonio
title Extraction automatique de termes combinant différentes informations
title_short Extraction automatique de termes combinant différentes informations
title_full Extraction automatique de termes combinant différentes informations
title_fullStr Extraction automatique de termes combinant différentes informations
title_full_unstemmed Extraction automatique de termes combinant différentes informations
title_sort extraction automatique de termes combinant différentes informations
publisher s.n.
url http://agritrop.cirad.fr/574178/
http://agritrop.cirad.fr/574178/1/document_574178.pdf
work_keys_str_mv AT lossioventurajuanantonio extractionautomatiquedetermescombinantdifferentesinformations
AT jonquetclement extractionautomatiquedetermescombinantdifferentesinformations
AT rochemathieu extractionautomatiquedetermescombinantdifferentesinformations
AT teisseiremaguelonne extractionautomatiquedetermescombinantdifferentesinformations
_version_ 1758024271682076672