Selon le Conseil National du Numérique, "la fouille de textes et de données (ou text and data mining - TDM) désigne un ensemble de traitements automatisés consistant à extraire des connaissances dans un ensemble de contenus numériques, qui peuvent inclure des textes, des données, des sons, des images ou d’autres éléments, ou une combinaison de ceux-ci. Elle permet d’analyser parallèlement de vastes quantités de données selon un critère de nouveauté ou de similarité, et ainsi de dégager des conclusions difficiles à appréhender par la simple lecture cursive".
Les services Istex fournis par l'Inist permettent la fouille de texte dans de vastes corpus. Actuellement 45 web services sont disponibles.
Cet atelier sera animé par Valérie Bonvallot de l'équipe TDM de l'INIST.
Inscriptions : ici