Postdoc d'1 an, TAL & Deeplearning, Projet PIA3 ARIA avec la société ESII. Dans le cadre du projet PIA3 (Programme d'investissements d'avenir) ESII (transfert technologique), entre la société ESII et l'équipe KID du laboratoire LGI2P d'IMT Mines Alès, nous souhaitons recruter un chercheur postdoctoral pour une durée de 1 an. **Contexte** ESII produit des bornes interactives permettant d'aiguillier des usagers sur des guichets adaptés à leur demande, par exemple dans les administrations (préfecture, mairie) ou autre services (par exemple hôpitaux). Les usagers arrivent au service en question et passent devant la borne sur laquelle ils sélectionnent la nature de leur demande. La borne assigne alors l'usager à la file d'attente du guichet le plus apte à répondre à sa requête et lui donne un ticket. ESII souhaite maintenant développer une borne actionnée vocalement, c'est à dire qu'au lieu de choisir une procédure sur l'écran, l'usager peut maintenant énoncer naturellement le motif de sa venue. La parole de l'usager est transcrite par une brique logicielle existant et notre travail vise à proposer une solution générique qui à partir de cette transcription (imparfaite) et de la base de données domaine doit être en mesure d'automatiquement suggérer le bon guichet (en temps contraint). **Missions attendues** Le travail de la personne recrutée consistera à travailler sur l'implémentation d'un système de machine learning à base de modèles de langue profonds contextualisés (deep contextualized language models, par exemple OpenAI ElMo ou Google BERT) pour permettre cette recommandation : 1. La première étape consistera à construire un système non-supervisé sur la base des plongements de mots extraits des couches supérieures d'un modèle de langue profond contextualisé et de mesures de similarité sémantiques hybrides (combinant plongements et mesures hiérarchiques). 2. Dans un deuxième temps, des données d'entraînement seront disponibles. Il faudra partir du même modèle de langue contextualisé profond et proposer une architecture permettant de répondre à cette tâche. Cela qui permettra de spécialiser le modèle de langue pré-calculé en le raffinant au travers de l'entraînement par les données annotées. 3. Les données d'entraînement initiales (construites synthétiquement) seront complétées au fur et à mesure de l'utilisa- tion de la solution par un feedback immédiat sur le résultat de l'affectation à un guichet (correct on non). Il faudra intégrer cette composante d'entraînement actif dans le système pour permettre de déterminer le moment oppor- tun pour faire la transition entre le modèle non-supervisé et le modèle supervisé et pour raffiner l'entraînement du modèle supervisé. *Profil recherché* *Formation*: Doctorat en Informatique (TAL) avec une première expérience de mise en opération de systèmes de machine learning et/ou une expérience en traitement automatique des langues par des approches en deep learning. *Compétences recherche*: Apprentissage Automatique et Profond; Traitement Automatique des Langues (word embeddings, modèles de langue profonds); Des compétences en Web Sémantique seraient un plus (RDF, SPARQL, etc.) *Compétences techniques*: Python3; scikit-learn; Pytorch ou Tensorflow *Compétences transversales*: Maîtrise native du Français ou assimilé (Niveau C1+); Anglais technique *Savoir être*: Implication et sérieux; Être force de proposition, Savoir travailler en équipe, Savoir communiquer sur l'avancement du travail à la fois avec des chercheurs spécialistes et avec des des décideurs. *Rémunération et bénéfices* *Statut* : Contractuel de la fonction publique *Durée du contrat* : 12 mois *Lieu du contrat* : IMT Mines Alès, Campus de Croupillac, Alès Rémunération brute annuelle 44 357¤, soit 2052¤ nets mensuels Pour postuler, envoyez un CV et une lettre de motivation à Andon Tchechmedjiev (andon.tchechmedjiev@mines-ales.fr) et à Jacky Montmain (jacky.montmain@mines-ales.fr)