Post-doc (H/F) en reconnaissance de la parole multilingue Application Deadline : 14 March 2023 General information Offer title : Post-doc (H/F) en reconnaissance de la parole multilingue (M/F) Reference : UMR9015-LUCOND-003 Number of position : 1 Workplace : ST AUBIN Date of publication : 21 February 2023 Type of Contract : FTC Scientist Contract Period : 12 months Expected date of employment : 1 April 2023 Proportion of work : Full time Remuneration : Entre 2 889 et 3 321 ¤ bruts mensuels selon expérience. Desired level of education : PhD Experience required : Indifferent Section(s) CN : Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues Missions Le projet vise au développement d'un système de transcription de la parole pour des énoncés dans des langues différentes avec éventuellement de l'alternance codique ("code-switching") au sein d'un même énoncé. Le projet se focalise tout particulièrement sur les situations nécessitant 3 langues ou plus avec les problèmes sous-jacents: * rareté des données d'alternance codique * prononciations des mots empruntées à d'autres langues * inventaire de phone propre à chaque langue * ... La personne intégrera l'équipe "Modèles, Méthodes et Multilinguisme" du LISN et elle sera en charge de concevoir et mettre en place des nouveaux outils multilingues de transcription de la parole. En fonction des compétences et des intérêts du candidat, le travail pourra se concentrer sur divers sujets de recherche tels que : * l'apprentissage automatique de la prononciation des mots empruntés (https://ieeexplore.ieee.org/abstract/document/6338277) * modélisation du phénomène d'alternance codique pour la transcription de la parole (https://arxiv.org/abs/2211.01458) * ... Activities * Étudier et tester les travaux récents du domaine * Proposer des nouvelles méthodes pour la transcription de la parole multilingue * Aider au développement du système de reconnaissance vocale du LISN (open-source et écrit en Pytorch pour la partie réseaux de neurones et Julia pour les algorithmes d'inférence) * mise en place de démonstration sur des jeux de tests multilingues * Participer à l'animation scientifique du groupe de recherche (groupe de lecture, supervision des stagiaires, ...) Skills Le candidat retenu devra être titulaire d'un doctorat en traitement automatique des langues avec idéalement une familiarité avec les système des transcriptions de type Kaldi ou k2. Nous recherchons en particulier les personnes avec un fort intérêt pour les problématiques des technologies de la parole pour les langues peu dotées en ressources. Work Context Le travail se déroulera au Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) sur le site "Belvédère". Le candidat retenu intégrera de l'équipe M^3 (Modèles, Méthodes et Multilinguisme) où il sera encadré par Lucas Ondel et Caio Corro. Cette équipe est spécialisée dans les méthodes d'apprentissage automatique appliquées aux traitements des langues et possède une forte expérience et une reconnaissance internationale dans les technologies de la parole. Postuler en ligne : https://emploi.cnrs.fr/Offres/CDD/UMR9015-LUCOND-003/Default.aspx