Stage M2: Paramétrisation CRF neuronal pour les analyseurs en dépendances de type graphe 1 Contexte scientifique ------------------------- L'analyse syntaxique en dépendances est une tâche essentielle en traitement automatique des langues. Récemment, l'utilisation de réseaux de neurones récurrents a permis un regain d'intérêt pour les modèles d'analyse structurellement plus simples, par exemple le système de Kiperwasser et Goldberg[3]. la notion de contexte étendu est très bien gérée par les réseaux, et le système grammatical n'a plus à prendre en compte ces contextes en interne, puisqu'ils lui sont donnés via les plongements lexicaux (/word embeddings/). Le but de ce stage est d'étudier la paramétrisation d'un analyseur en dépendances projectives par un modèle probabiliste de type CRF (champs de Markov aléatoire), où les potentiels sont calculés par des réseaux de neurones. Un tel système a déjà été proposé pour les grammaires syntagmatiques. D'autre part des systèmes neuronaux ont déjà été proposés pour l'analyse syntaxique en dépendances mais jamais avec un modèle probabilistes global. Profil recherché: Niveau M2, bonne connaissance d'un langage de programmation (python ou c++ idéalement), un intérêt fort pour l'apprentissage automatique appliqué au traitement automatique des langues. 2 Administratif --------------- Le stage aura lieu au LIPN (CNRS - Université Paris13 - Paris Sorbonne Cité) du 01/04/2017 au 30/09/2017 et sera encadré par Joseph Le Roux et/ou Nadi Tomeh. Le/La stagiaire fera partie de l'équipe de recherche RCLN, membre du labex EFL (axe "sémantique computationnelle"), dans la structure de recherche fédérative MathSTIC de CNRS/Paris 13 (axe "Optimisation et Apprentissage pour les contenus numériques"). Les candidatures (CV et lettre de motivation) doivent être adressées à Joseph Le Roux (leroux@lipn.fr) avant le 15/1/17.