*** Annotation de corpus en entités nommées avec apprentissage actif *** Lieu du stage : laboratoire LATTICE, Montrouge Encadrants : Frédérique Mélanie, Thierry Poibeau (LATTICE) * Motivation et descriptif On dispose aujourd'hui d'outils de traitement des langues opérationnels et efficaces, en partie grâce à l'apprentissage automatique. On s'aperçoit malgré tout souvent que ces outils restent peu robustes face à la diversité des corpus. Par exemple, les outils de reconnaissance des entités nommées sont souvent mis au point et évalués sur des corpus comme le journal Le Monde, mais les performances observées sur des corpus différents sont souvent très faibles, même quand il s'agit de texte édités et supposés écrits dans un "français correct". Dans ce contexte, les performances rapportées sur les jeux de test classiques sont très peu informatives et on se heurte dès lors à des problèmes bien connus, notamment le coût souvent prohibitif pour obtenir un corpus annoté représentatif. Des techniques comme l'apprentissage actif peuvent aider à contourner partiellement cette difficulté, en offrant des moyens d'annotation rapides et efficaces. Des interfaces graphiques évoluées permettant en outre d'améliorer de manière notable la vitesse et l'efficacité de l'annotation en vue d'obtenir un modèle performants pour une tâche donnée. Le stage portera donc sur l'annotation des entités nommées (essentiellement noms de personnes et noms de lieux) au sein de romans du 19e ou 20e siècle, avec une visée applicative (obtention d'un corpus annoté), et plus expérimentale (test de l'efficacité de l'annotation). L'application visée est une exploration du "Paris des écrivains" : comment les écrivains parlent-ils de Paris ? Quels quartiers sont mis en avant ? Quel imaginaire autour de Paris ? * Public visé Ce stage s'adresse à un(e) étudiant(e) de niveau M2, de formation TAL ou Humanités numériques. * Conditions du stage Stage de 4 à 6 mois, à partir du printemps 2020, indemnisé suivant les conditions en vigueur. Convention de stage obligatoire. * Comment candidater ? Envoyer un mail avec quelques mots sur votre intérêt pour ce stage dans le corps du mail, et en pièces attachées un CV et un relevé de notes récent. Adresser le mail à Thierry Poibeau (thierry.poibeau@ens.fr)