Objet : Stage M2 en TAL, Analyse distributionnelle en domaine de spécialité Aujourd'hui les modèles d'analyse distributionnelle performants fournissent des ressources « prêt-à-porter » construites à partir de très gros corpus tout-venant de langue générale. Ces word embeddings génériques ne sont pas suffisants pour représenter la sémantique en domaine de spécialité, et il est donc nécessaire de les construire sur la base de corpus spécialisés. Dans ce contexte, nous souhaitons porter notre attention sur la prise en compte des termes dans des méthodes distributionnelles en mettant en oeuvre des mécanismes de généralisation terminologique qui permettent de factoriser des unités terminologiques. Plus particulièrement, il s'agira de développer une approche permettant de remplacer tout terme par un terme plus générique par une acquisition préalable de classes sémantiques acquises sur un corpus de langue générale ou d'un domaine proche de celui étudié. Ce stage s'inscrit dans le projet ANR ADDICTE (Analyse distributionnelle en domaine de spécialité) et pourra donner lieu à une thèse selon les résultats du stage. Le stage est rémunéré selon les règles en vigueur. Niveau: Master 2 Durée: 5 à 6 mois Lieu: Nantes ou Orsay Pour présenter votre candidature, merci d'envoyer CV, lettre de motivation et relevé de notes à Emmanuel Morin (emmanuel.morin@univ-nantes.fr) et Thierry Hamon (thierry.hamon@limsi.fr)