************************************************************************ Offre de stage Dans le cadre d'un financement CORLI-Ortolang obtenu conjointement par les laboratoires CLESTHIA et LIDILEM, nous recherchons 2 stagiaires pour la période de décembre 2017 à Février 2018 (durée 2 mois et demi, gratification de 1800¤/brut au total). L'un des stagiaires sera rattaché au laboratoire CLESTHIA (Paris Sorbonne), l'autre au laboratoire LIDILEM (Campus de Grenoble). Contexte Les deux laboratoires ont constitué et continuent d'alimenter des corpus d'écrits d'élèves : - pour Lidilem, un corpus longitudinal couvrant l'ensemble de l'école élémentaire (du Cours Préparatoire au Cours Moyen 2) : corpus Scoledit ; ce corpus est constitué de productions suscitées par la recherche ; - pour Clesthia, un corpus reflétant le développement des compétences scripturales du début de l'école primaire à l'université : corpus Ecriscol ; ce corpus est constitué de productions écologiques. Ces deux corpus sont déjà en partie accessibles, avec les enrichissements disponibles : - Ecriscol : http://syled.univ-paris3.fr/ecriscol/CORPUS-TEST/ - Scoledit : http://otus.u-grenoble3.fr/scoledit Les caractéristiques des corpus réunis ainsi que les objets de recherche privilégiés par les équipes ont conduit à élaborer des procédures de traitement différentes dont les résultats sont dans des formats spécifiques que l'on veut faire converger vers un format partagé (XML-TEI). Missions - Analyse des spécificités du corpus Ecriscol (stagiaire Clesthia) ou du corpus Scoledit (stagiaire Lidilem). - Mise en commun de ces analyses - Étude du standard XML-TEI - Proposition d'un format commun, pour les deux corpus Ecriscol/Scoledit, aux normes TEI - Conception et développement de routines de conversion ou d'aide à la conversion pour le passage des formats actuels des corpus au format commun. Profil demandé - Niveau master 2 en Traitement Automatique des Langues - Compétences XML - Compétences en développement informatique (langage non défini mais adapté au développement de routines d'extraction et de conversion du type Python, Perl, Java...). - Une connaissance de la TEI serait un plus. Contacts - CLESTHIA : Serge Fleury (sergefleury@gmail.com) - LIDILEM : Claude Ponton (claude.ponton@univ-grenoble-alpes.fr)