Un postdoc sur le thème de l'AMR (Abstract Meaning Representation) est proposé chez Orange-Innovation. - Durée : 12 mois. - Lieu : Orange-Innovation, Data and Artificial Intelligence, Lannion (France). - Début : dès que possible. L'analyse sémantique exploitant la représentation AMR (Abstract Meaning Representation) permet d'obtenir des résultats intéressants en termes de qualité (Smatch/F-mesure de 83% pour l'Anglais, 74% pour le Français ou l'Espagnol). Mais, ces résultats restent encore insuffisants pour envisager de l'exploiter sur d'autres langues que l'Anglais (quand la mesure de la qualité est inférieure à 82%). Même en Anglais, les bons scores masquent des défauts qualitatifs qui restent rédhibitoires pour une utilisation réelle. De plus, toutes les bibliothèques que nous avons testées se sont avérées trop lentes pour les exigences temps réel de certaines tâches applicatives comme le question-réponse. Objectif du postdoc : L'objectif de ce post-doc est double : 1) Etudier les outils du parsing AMR existants et les technologies et architectures qu'ils mettent en oeuvre afin d'établir une politique d'amélioration de ce parsing. 2) Améliorer un outil existant ou de créer un nouvel outil pour : - Dépasser l'état de l'art en termes de Smatch/f-mesure, notamment pour les langues autres que l'Anglais. - Diminuer la taille des ressources nécessaires (temps d'apprentissage, taille de RAM/GPU). - Augmenter la vitesse d'inférence (phrases/secondes). - Éventuellement construire un modèle multi-tâches qui intègre à l'analyse AMR d'autres tâches (NER/NEL, coréférences). Ce travail portera donc principalement sur l'algorithmique mais il nécessitera aussi de travailler sur les données. Les principaux verrous à lever sont : 1) Obtenir un graphe sémantique identique pour des expressions sémantiquement identiques mais syntactiquement différentes et en différentes langues. 2) Limiter la taille des modèles. Votre profil : Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste : - Thèse de doctorat en informatique avec une expérience en deep-learning. - Des connaissances en NLP, notamment sur le parsing et des connaissances en sémantique. - Connaissances en Python, PyTorch etc. - Connaissances de Julia appréciées. Résultats attendus : - Un état de l'art sur le parsing AMR (T0 + 2 mois) - Un plan de travail pour l'amélioration de l'état de l'art (T0+3) - Un premier outil monolingue pour l'Anglais (T0+6) - Un premier outil multilingue (T0+12) Le plus de l'offre Vous vous intégrez dans un programme de Recherche, une équipe à la fois fortement impliquée dans le transfert technologique vers les équipes opérationnelles et les collaborations avec des équipes académiques. Pour ce sujet en particulier, l'équipe a déjà une expérience sur l'AMR (outils, corpus) et vous facilitera l'appropriation du sujet et votre montée en compétence. De plus, vous pourrez compter sur son soutien, tant sur le plan scientifique que technique. Si vous le souhaitez, vous pourrez soumettre la publication de vos travaux, en particulier aux communautés de TALN. Il serait possible de prolonger la mission, par exemple, dans le but de con struire une deuxième version de l'outil multilingue. Vous pouvez déposer votre candidature sur le site Orange Jobs. Offre sur Orange jobs en français : https://orange.jobs/jobs/v3/offers/115929?lang=fr Offre sur Orange jobs en anglais : https://orange.jobs/jobs/v3/offers/115929?lang=en