Text and Data Mining

L'analyse des masses de données textuelles nécessite l'utilisation de méthodes mêlant harmonieusement différentes disciplines comme l'informatique, la linguistique ou les statistiques. L'ensemble de ces méthodes utiles pour traiter de telles données, souvent hétérogènes, forme le socle de la Science des Données Textuelles. Dans ce cadre, les approches de fouille de textes permettent de découvrir des connaissances utiles pour des experts issus généralement de différents domaines (santé, agriculture, etc.). Ce module présentera les fondements des approches proposées et leur mise en oeuvre à travers l'utilisation de différents outils et méthodologies dans le contexte de plusieurs projets pluridisciplinaires autour des thématiques de sécurité alimentaire et One Health (une seule santé). Les méthodes de fouille de textes mobilisent les approches éprouvées de fouille de données (cf. première partie du module) en y intégrant des traitements dédiés et des représentations spécifiquement adaptées aux données textuelles. Cet enseignement décrira des méthodes de fouille de textes qui seront appliquées à deux tâches spécifiques, à savoir l'extraction de la terminologie à partir de textes et la classification automatique de données textuelles. L'enseignement permettra d'acquérir des compétences sur les concepts fondamentaux de Science des Données Textuelles en y adossant un volet applicatif via la présentation d'outils et méthodes dédiées.

Saved in:
Bibliographic Details
Main Author: Roche, Mathieu
Format: monograph biblioteca
Language:eng
Published: CIRAD
Online Access:http://agritrop.cirad.fr/603458/
http://agritrop.cirad.fr/603458/1/Resume_DU_SDM_2022-23_final.pdf
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:L'analyse des masses de données textuelles nécessite l'utilisation de méthodes mêlant harmonieusement différentes disciplines comme l'informatique, la linguistique ou les statistiques. L'ensemble de ces méthodes utiles pour traiter de telles données, souvent hétérogènes, forme le socle de la Science des Données Textuelles. Dans ce cadre, les approches de fouille de textes permettent de découvrir des connaissances utiles pour des experts issus généralement de différents domaines (santé, agriculture, etc.). Ce module présentera les fondements des approches proposées et leur mise en oeuvre à travers l'utilisation de différents outils et méthodologies dans le contexte de plusieurs projets pluridisciplinaires autour des thématiques de sécurité alimentaire et One Health (une seule santé). Les méthodes de fouille de textes mobilisent les approches éprouvées de fouille de données (cf. première partie du module) en y intégrant des traitements dédiés et des représentations spécifiquement adaptées aux données textuelles. Cet enseignement décrira des méthodes de fouille de textes qui seront appliquées à deux tâches spécifiques, à savoir l'extraction de la terminologie à partir de textes et la classification automatique de données textuelles. L'enseignement permettra d'acquérir des compétences sur les concepts fondamentaux de Science des Données Textuelles en y adossant un volet applicatif via la présentation d'outils et méthodes dédiées.