Extraction automatique de termes combinant différentes informations
Pour une communauté, la terminologie est essentielle car elle permet de décrire, échanger et récupérer les données. Dans de nombreux domaines, l'explosion du volume des données textuelles nécessite de recourir à une automatisation du processus d'extraction de la terminologie, voire son enrichissement. L'extraction automatique de termes peut s'appuyer sur des approches de traitement du langage naturel. Des méthodes prenant en compte les aspects linguistiques et statistiques proposées dans la littérature, résolvent quelques problèmes liés à l'extraction de termes tels que la faible fréquence, la complexité d'extraction de termes de plusieurs mots, ou l'effort humain pour valider les termes candidats. Dans ce contexte, nous proposons deux nouvelles mesures pour l'extraction et le "ranking" des termes formés de plusieurs mots à partir des corpus spécifiques d'un domaine. En outre, nous montrons comment l'utilisation du Web pour évaluer l'importance d'un terme candidat permet d'améliorer les résultats en terme de précision. Ces expérimentations sont réalisées sur le corpus biomédical GENIA en utilisant des mesures de la littérature telles que C-value.
Main Authors: | , , , |
---|---|
Format: | conference_item biblioteca |
Language: | fre |
Published: |
s.n.
|
Subjects: | C30 - Documentation et information, 000 - Autres thèmes, |
Online Access: | http://agritrop.cirad.fr/574178/ http://agritrop.cirad.fr/574178/1/document_574178.pdf |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
dig-cirad-fr-574178 |
---|---|
record_format |
koha |
spelling |
dig-cirad-fr-5741782022-04-15T09:18:48Z http://agritrop.cirad.fr/574178/ http://agritrop.cirad.fr/574178/ Extraction automatique de termes combinant différentes informations. Lossio Ventura Juan Antonio, Jonquet Clément, Roche Mathieu, Teisseire Maguelonne. 2014. In : Actes de la 21ème Conférence sur le Traitement automatique des langues naturelles (TALN'2014), 1-4 juillet 2014, Marseille, France. Brigitte Bigi (ed.). s.l. : s.n., 407-412. ISBN 978-2-9518233-6-5 Conférence sur le Traitement automatique des langues naturellles. 21, Marseille, France, 1 Juillet 2014/4 Juillet 2014. Researchers Extraction automatique de termes combinant différentes informations Lossio Ventura, Juan Antonio Jonquet, Clément Roche, Mathieu Teisseire, Maguelonne fre 2014 s.n. Actes de la 21ème Conférence sur le Traitement automatique des langues naturelles (TALN'2014), 1-4 juillet 2014, Marseille, France C30 - Documentation et information 000 - Autres thèmes Pour une communauté, la terminologie est essentielle car elle permet de décrire, échanger et récupérer les données. Dans de nombreux domaines, l'explosion du volume des données textuelles nécessite de recourir à une automatisation du processus d'extraction de la terminologie, voire son enrichissement. L'extraction automatique de termes peut s'appuyer sur des approches de traitement du langage naturel. Des méthodes prenant en compte les aspects linguistiques et statistiques proposées dans la littérature, résolvent quelques problèmes liés à l'extraction de termes tels que la faible fréquence, la complexité d'extraction de termes de plusieurs mots, ou l'effort humain pour valider les termes candidats. Dans ce contexte, nous proposons deux nouvelles mesures pour l'extraction et le "ranking" des termes formés de plusieurs mots à partir des corpus spécifiques d'un domaine. En outre, nous montrons comment l'utilisation du Web pour évaluer l'importance d'un terme candidat permet d'améliorer les résultats en terme de précision. Ces expérimentations sont réalisées sur le corpus biomédical GENIA en utilisant des mesures de la littérature telles que C-value. conference_item info:eu-repo/semantics/conferenceObject Conference info:eu-repo/semantics/publishedVersion http://agritrop.cirad.fr/574178/1/document_574178.pdf application/pdf Cirad license info:eu-repo/semantics/openAccess https://agritrop.cirad.fr/mention_legale.html |
institution |
CIRAD FR |
collection |
DSpace |
country |
Francia |
countrycode |
FR |
component |
Bibliográfico |
access |
En linea |
databasecode |
dig-cirad-fr |
tag |
biblioteca |
region |
Europa del Oeste |
libraryname |
Biblioteca del CIRAD Francia |
language |
fre |
topic |
C30 - Documentation et information 000 - Autres thèmes C30 - Documentation et information 000 - Autres thèmes |
spellingShingle |
C30 - Documentation et information 000 - Autres thèmes C30 - Documentation et information 000 - Autres thèmes Lossio Ventura, Juan Antonio Jonquet, Clément Roche, Mathieu Teisseire, Maguelonne Extraction automatique de termes combinant différentes informations |
description |
Pour une communauté, la terminologie est essentielle car elle permet de décrire, échanger et récupérer les données. Dans de nombreux domaines, l'explosion du volume des données textuelles nécessite de recourir à une automatisation du processus d'extraction de la terminologie, voire son enrichissement. L'extraction automatique de termes peut s'appuyer sur des approches de traitement du langage naturel. Des méthodes prenant en compte les aspects linguistiques et statistiques proposées dans la littérature, résolvent quelques problèmes liés à l'extraction de termes tels que la faible fréquence, la complexité d'extraction de termes de plusieurs mots, ou l'effort humain pour valider les termes candidats. Dans ce contexte, nous proposons deux nouvelles mesures pour l'extraction et le "ranking" des termes formés de plusieurs mots à partir des corpus spécifiques d'un domaine. En outre, nous montrons comment l'utilisation du Web pour évaluer l'importance d'un terme candidat permet d'améliorer les résultats en terme de précision. Ces expérimentations sont réalisées sur le corpus biomédical GENIA en utilisant des mesures de la littérature telles que C-value. |
format |
conference_item |
topic_facet |
C30 - Documentation et information 000 - Autres thèmes |
author |
Lossio Ventura, Juan Antonio Jonquet, Clément Roche, Mathieu Teisseire, Maguelonne |
author_facet |
Lossio Ventura, Juan Antonio Jonquet, Clément Roche, Mathieu Teisseire, Maguelonne |
author_sort |
Lossio Ventura, Juan Antonio |
title |
Extraction automatique de termes combinant différentes informations |
title_short |
Extraction automatique de termes combinant différentes informations |
title_full |
Extraction automatique de termes combinant différentes informations |
title_fullStr |
Extraction automatique de termes combinant différentes informations |
title_full_unstemmed |
Extraction automatique de termes combinant différentes informations |
title_sort |
extraction automatique de termes combinant différentes informations |
publisher |
s.n. |
url |
http://agritrop.cirad.fr/574178/ http://agritrop.cirad.fr/574178/1/document_574178.pdf |
work_keys_str_mv |
AT lossioventurajuanantonio extractionautomatiquedetermescombinantdifferentesinformations AT jonquetclement extractionautomatiquedetermescombinantdifferentesinformations AT rochemathieu extractionautomatiquedetermescombinantdifferentesinformations AT teisseiremaguelonne extractionautomatiquedetermescombinantdifferentesinformations |
_version_ |
1758024271682076672 |