Cette offre de stage s'inscrit dans le cadre d'une collaboration entre le laboratoire Lidilem et le LIG (Univ. Grenoble Alpes) et est proposée par A. Nardy (Lidilem), S. Rossato (LIG) et F. Portet (LIG). Contexte général : Dans le cadre du projet DyLNet (Dynamiques langagières, apprentissages linguistiques et sociabilité à l'école maternelle : apport des capteurs de proximité pour le recueil de données massives - https://dylnet.univ-grenoble-alpes.fr/), coordonné par Aurélie Nardy et financé par l'Agence Nationale de la Recherche (ANR-16-CE28-0013), les enfants et adultes d'une école maternelle ont été équipés, une semaine par mois, pendant 3 ans, de capteurs enregistrant à la fois les proximités entre individus et leur voix. Une partie des enregistrements a été transcrite avec le logiciel ELAN (https://tla.mpi.nl/tools/tla-tools/elan/download/). Ce logiciel permet d'aligner la transcription sur le signal et également de faire différents types d'annotations. La finalité de ce projet est d'examiner comment les relations qu'entretiennent les enfants à l'école maternelle influencent le développement de leur langage oral (comment les enfants s'influencent les uns les autres et comment les adultes présents dans l'école - enseignants et ATSEM - influencent le langage enfantin). Le protocole de cette étude a été soumis au Comité Opérationnel d'Évaluation des Risques Légaux et Éthiques de l'INRIA et de la Commission Nationale de l'Informatique et des Libertés qui l'ont validé. Dans ce cadre, des mesures strictes garantissant la confidentialité et l'anonymat des participants ont été prises. À ce titre, toute personne en contact avec des données issues de l'étude s'engage à respecter ces mesures et signera un engagement de confidentialité. Missions : L'objectif de ce stage est de proposer un système de reconnaissance de la parole des enseignants. La difficulté dans la reconnaissance de ce type de parole réside dans les conditions d'enregistrement particulières (salle de classe) et le fait que les adultes s'adressent à de jeunes enfants. Cependant, la volonté de proposer une référence aux enfants pour leurs apprentissages amène les enseignants à prendre soin de leur production langagière, notamment au niveau de l'articulation. Les enregistrements à disposition permettront de créer des corpus de développement et de test pour adapter et évaluer le système de reconnaissance de parole. Nous utiliserons la boite à outils open source SpeechBrain (Ravanelli & Parcollet, 2021) programmée en PyTorch. SpeechBrain permet d'utiliser les dernières méthodes de pointe pour la reconnaissance de la parole, telles que les CTC, CTC+attention, transducers et transformers. Profil : - Étudiant en master 2 en traitement automatique du langage naturel, informatique ou science des données. - Bonne maîtrise de Python et expérience avec un framework de deep learning. Environnement scientifique : Les travaux seront menés au sein du LIDILEM et de l'équipe et Getalp du laboratoire LIG (http://sigma.imag.fr et https://lig-getalp.imag.fr). La personne recrutée sera accueillie au sein de ces équipes qui offrent un environnement de travail stimulant, multinational et agréable. Instructions pour postuler : Les candidatures sont attendues jusqu'au 10 janvier 2021. Elles doivent contenir : CV + lettre/message de motivation + lettre(s) de recommandation (ou noms de lettres potentielles). Les candidatures seront examinées au fur et à mesure. Il est donc conseillé de postuler le plus tôt possible. Contacts : François Portet, Professeur des Universités, LIG, Univ. Grenoble Alpes, francois.portet@imag.fr Solange Rossato, Maître de Conférences, LIG, Univ. Grenoble Alpes, solange.rossato@univ-grenoble-alpes.fr Aurélie Nardy, Maître de Conférences, LIDILEM, Univ. Grenoble Alpes, aurelie.nardy@univ-grenoble-alpes.fr Références Ravanelli, M., Parcollet, T., Plantinga, P., Rouhe, A., Cornell, S., Lugosch, L., ... & Bengio, Y. (2021). SpeechBrain: A General-Purpose Speech Toolkit. https://arxiv.org/pdf/2106.04624.pdf