Ingénieur(e) de Recherche en Extraction d'Informations Cette offre s'inscrit dans le cadre d'une collaboration entre INRIA (équipe Almanach) et le Ministère de la Transition Écologique (MTE) sur l'extraction d'information au sein de dossiers d'étude d'impacts (par exemple un projet d'extension d'une station d'épuration ou de déploiement d'un parc éolien). Description détaillée de l'offre (et candidature): https://jobs.inria.fr/public/classic/fr/offres/2022-04928 Activités principales : - Etudier les méthodes d'acquisition de connaissances, d'extraction d'informations et de classification (annotation de segments) qui pourraient être utilisées dans le cadre du projet - Etudier les différentes approches - Explorer les étapes de recherche proposées au travers du développement d'une preuve de concepts et d'expériences menées sur les données disponibles - Interactions avec les experts du MTE pour déterminer les informations pertinentes à extraire dans les dossiers et pour conduire des évaluations des outils développés - Supervision éventuelle d'une campagne manuelle d'annotations et/ou de validation de pré-annotations - Rédiger un rapport de recherche pour documenter le projet. Compétences recherchées : - Python (avancé), Perl (notions) - Experience bibliothèques d'apprentissage automatique et profond (Pytorch, TensorFlow, Keras, transformers huggingface, Scikit-Learn) - Expérience dans les architectures de réseaux de neurones (dont transformeurs) et modèles de langues - Expérience académique en algorithmes de traitement automatique du langage naturel, en particulier sur l'extraction d'information et/ou l'acquisition de connaissances - Une expérience dans une équipe de recherche Présentation de l'équipe: ALMANACH Automatic Language Modelling and Analysis & Computational Humanities http://almanach.inria.fr/ https://www.inria.fr/fr/almanach Candidature: - sur le site https://jobs.inria.fr/public/classic/fr/offres/2022-04928