== Stage 2 à 3 mois, projet LGIDF, laboratoire Structures Formelles du Langage (CNRS & Univ. Paris 8) = https://www.sfl.cnrs.fr/stage-lgidf * Description : Le projet LGIDF a pour but d'archiver et rendre accessibles à un public large, en français, des informations linguistiques sur les langues parlées en (Ile-de-)France, tout particulièrement, mais non exclusivement, les langues de l'immigration récente. Il se situe dans la complémentarité du travail de recensement des "langues de France" effectué sous l'égide de la Direction Générale de la Langue Française et des Langues de France (DGLFLF). Site du projet : https://lgidf.cnrs.fr L'objectif du stage est de contribuer à la mise en ligne des gloses et traductions des différents fichiers audio du projet sur la plateforme Cocoon. Il s'agira principalement de développer des scripts de conversion de fichiers de gloses des items au format XML TEI, et de vérifier l'ensemble des items une fois disponibles en ligne. Dans un deuxième temps, le stagiaire devra également s'occuper de la conversion de fichiers de gloses/traduction des items en fichiers HTML en prenant soin de procéder à l'alignement sur le son. * Profil recherché : L3/M1/M2 en linguistique informatique / traitement automatique des langues, avec : -- bonnes compétences en informatique -- bonnes compétences en linguistique de corpus -- bonne connaissance de HTML5 et de XML -- maîtrise d'un langage de script (Python ou Perl apprécié) -- Autonomie * Modalités : Télétravail * Durée : 2 à 3 mois, à partir du 28 juin 2021 * Stage financé : gratification de stage habituelle * Personne à contacter : Sarra El Ayari (IR CNRS) - sarra.elayari@cnrs.fr