Selon le Conseil National du Numérique, "la fouille de textes et de données (ou text and data mining - TDM) désigne un ensemble de traitements automatisés consistant à extraire des connaissances dans un ensemble de contenus numériques, qui peuvent inclure des textes, des données, des sons, des images ou d’autres éléments, ou une combinaison de ceux-ci. Elle permet d’analyser parallèlement de vastes quantités de données selon un critère de nouveauté ou de similarité, et ainsi de dégager des conclusions difficiles à appréhender par la simple lecture cursive".
Les services Istex fournis par l'Inist permettent la fouille de texte dans de vastes corpus. Actuellement 45 web services sont disponibles.
Programme :
A quoi sert la fouille de textes ?
Présentation du catalogue des web services de fouille de textes développés à l’Inist ou dans le cadre de partenariats : Istex TDM
- Présentation de la plate-forme TDM Factory
- bibCheck
- textSummarize
- entityTag
- Echanges
Cet atelier sera animé par Valérie Bonvallot de l'équipe TDM de l'INIST.
Inscriptions : ici