Offres d'emploi Inria > Offre n°2026-09725 Post-Doctorant(e) en Traitement Automatique des Langues : extraction d'information frugale pour le renseignement Type de contrat : CDD Niveau de diplôme exigé : Thèse ou équivalent Autre diplôme apprécié : Doctorat en Traitement Automatique des Langues, intelligence artificielle, apprentissage automatique ou domaine connexe. Fort intérêt pour la recherche appliquée et les problématiques liées au domaine défense. Fonction : Personnel des fonctions support (IT) Contexte et atouts du poste Le projet CapiTAL (extraction d'information et capitalisation automatique des connaissances pour le renseignement) vise à développer de nouvelles méthodes et ressources pour l'extraction automatique d'information à destination du renseignement, dans un contexte marqué par la spécificité du domaine défense (jargon spécialisé, phénomènes rares, données sensibles et faiblement annotées). D'une durée de trois ans, du 1er janvier 2026 jusqu'au 31 décembre 2028, le projet est structuré autour de deux axes complémentaires : Axe 1 : optimisation d'algorithmes d'extraction d'information, en particulier l'extraction d'entités, avec des approches frugales et robustes adaptées à un domaine pauvre en données. Axe 2 : constitution de corpus textuels annotés représentatifs des besoins du renseignement, incluant de nouvelles conventions d'annotation couvrant des phénomènes spécifiques au domaine de la défense. Les résultats attendus incluent des méthodologies innovantes, des modèles d'extraction d'information mieux alignés avec les besoins défense, ainsi que des ressources réutilisables (corpus annotés, codes sources, modèles entraînés). Dans ce cadre, le/la post-doctorant(e) recruté(e) interviendra principalement sur l'axe 1, dont il/elle sera le ou la pilote, en collaboration avec avec un(e) ingénieur(e) en charge de l'axe 2 et sous l'encadrement d'une ingénieure expérimentée, responsable du projet. Le/la post-doctorant(e) travaillera au sein d'Inria Défense & Sécurité créé pour fédérer les actions d'Inria répondant aux besoins numériques des forces armées et du ministère de l'Intérieur. Il/elle sera rattaché(e) au pôle Données, chargé de concevoir, entraîner et valoriser des ressources linguistiques, dans une démarche collaborative entre équipes de recherche Inria, ministères et partenaires industriels. Mission confiée Le/la post-doctorant(e) aura pour mission principale de concevoir, développer et évaluer de nouvelles approches algorithmiques et modèles pour l'extraction d'information dans le domaine du renseignement, en particulier pour l'extraction d'entités, de relations et d'événements, dans un contexte de données peu ou pas annotées. Il/elle pilotera les travaux de recherche de l'axe 1, avec un accent sur la frugalité de l'adaptation de domaine, la généralisation et la robustesse des modèles face aux spécificités linguistiques et sémantiques du domaine de la défense. Principales activités Les activités s'inscrivent principalement dans l'axe 1 du projet et comprennent notamment : Recherche et développement méthodologique Adaptation frugale de modèles d'extraction d'information Développement de méthodes zero-shot et few-shot pour des relations spécifiques au domaine défense, peu ou pas présentes hors domaine. Exploration de techniques de transport optimal pour l'initialisation de représentations de nouvelles relations. Conception de formalismes hybrides combinant classification de relations et extraction ouverte de relations, afin de gérer simultanément relations connues et relations émergentes. Étude de méthodes semi-supervisées. Généralisation et robustesse aux formes de surface § Développement d'approches rendant les modèles agnostiques à la forme des entités, notamment via le masquage des segments à extraire. Exploitation de la structure syntaxique pour organiser le contexte. Conception et expérimentation d'architectures combinant embeddings de type BERT et modèles arborescents (TreeLSTM, puis Tree- Transformer). Analyse et gestion des cas où les entités ne correspondent pas exactement à des constituants syntaxiques (par exemple via des boundary regressors). Extension à d'autres tâches d'extraction d'information Déclinaison des méthodes développées vers la coréférence, la désambiguïsation d'entités, le slot filling, l'extraction de relations et d'événements. Traitement de paires et triplets de segments dans des cadres unifiés. Évaluation Collaboration avec l'ingénieur(e) sur le ré-entraînement et l'évaluation des modèles à mesure que de nouveaux corpus annotés deviennent disponibles. Evaluation des modèles et analyse des erreurs afin d'identifier les limites. Valorisation scientifique Documentation des approches développées et des résultats obtenus. Rédaction de publications scientifiques et participation à des conférences ou ateliers pertinents du domaine. Compétences Maîtrise du français écrit et parlé (données en français). Expertise en NLP / TAL, notamment en extraction d'entités, relations, événements ou tâches connexes. Solides compétences en apprentissage automatique et deep learning pour le texte. Expérience avec les modèles de langue de type Transformer (BERT et dérivés). Intérêt ou expérience pour les approches zero-shot / few-shot, l'adaptation de domaine et les méthodes semi-supervisées. Bon niveau en programmation, idéalement en Python. Expérience avec le logiciel de gestion de version Git. Compétences transverses : Capacité à mener des travaux de recherche de manière autonome. Goût pour l'expérimentation, l'analyse d'erreurs et l'itération méthodologique. Aptitude au travail collaboratif Bonnes capacités de communication écrite et orale (français et anglais scientifique). Avantages Restauration subventionnée Transports publics remboursés partiellement Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement) Possibilité de télétravail (après 3 mois d'ancienneté) et aménagement du temps de travail Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.) Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria) Partager Informations générales Ville : Grenoble Centre Inria : Siège Date de prise de fonction souhaitée : 2026-04-01 Durée de contrat : 2 ans Date limite pour postuler : 2026-02-28 Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti. Consignes pour postuler Sécurité défense : Ce poste est susceptible d'être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L'autorisation d'accès à une zone est délivrée par le chef d'établissement, après avis ministériel favorable, tel que défini dans l'arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l'annulation du recrutement. Politique de recrutement : Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap. Contacts Équipe Inria : DIRECTION Recruteur : Cosmidis Lucas / lucas.cosmidis@inria.fr A propos d'Inria Inria est l'institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l'interface d'autres disciplines. L'institut fait appel à de nombreux talents dans plus d'une quarantaine de métiers différents. 900 personnels d'appui à la recherche et à l'innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie. Offre en ligne : https://jobs.inria.fr/public/classic/fr/offres/2026-09725