Sujet de stage M2 recherche en TAL : acquisition d'un analyseur en dépendances du français médiéval Dans le cadre du projet ANR Syntactic Reference Corpus of Medieval French (SRCMF, 2008-2011), un Treebank (une collection d'arbres) d'analyses en dépendances d'énoncés du français médiéval a été constitué. Il comprend 260 000 mots (parmi lesquels environ 27 000 têtes verbales) annotées en étiquettes morpho-syntaxiques et reliés par des relations de dépendances étiquetées. L'objectif du stage est d'exploiter ce corpus par apprentissage automatique afin d'acquérir un analyseur en dépendances du français médiéval, éventuellement couplé à un étiqueteur morpho-syntaxique. Ces outils pourront être exploités sur de nouveaux textes. Ils permettront d'étudier précisément les spécificités grammaticales du français médiéval, en comparaison avec celles du français contemporain. Le stage bénéficiera de l'encadrement d'une spécialiste du français médiéval (Sophie Prévost) et de spécialistes du TAL et de l'apprentissage automatique (Matthieu Constant et Isabelle Tellier). Compétences requises : - niveau M2 ou ingénieur en informatique ou en TAL - Connaissances (ou au minimum intérêt argumenté) en TAL et en apprentissage automatique - Compétences en programmation Conditions du stage : - Rémunération : prime de stage (1/3 du SMIC). - Durée : 4 à 6 mois en commençant dès que possible en 2014. - Lieu : le stage sera encadré en collaboration par le LIGM à Marne-la-vallée (http://ligm.u-pem.fr) et le Lattice à Montrouge (http://www.lattice.cnrs.fr), trajets à prévoir entre les deux lieux envoyer CV + lettre de motivation à Matthieu Constant (Matthieu.Constant@u-pem.fr), Sophie Prévost (sophie.prevost@ens.fr), Isabelle Tellier (isabelle.tellier@univ-paris3.fr)