La Direction Générale de l'Armement (DGA, direction du Ministère des Armées) recrute un stagiaire en Extraction d'Information, descriptif de l'offre ci-dessous. N'hésitez pas à nous contacter pour plus de renseignements. *Intitulé du poste *: Extraction de relations dans des documents de renseignement ouvert *Domaine(s)* : INFORMATIQUE *Sous-domaine(s)* : Intelligence artificielle *Niveau(x) d'étude requis* : Bac +5 et plus *Diplôme(s) préparé(s)* : Ingénieur ou M2 Expérience en TAL et en IA. *Compétences requises *: Maîtrise en programmation Python et du framework TensorFlow ou PyTorch. Aisance avec l'environnement Linux et le script shell. Autonomie et force de proposition. Apprécie le travail en équipe. Des connaissances sur les API de type REST sont appréciables. *Durée* : 6 mois *Organisme* : Direction générale de l'armement *Localisation *: BRUZ *Gratification/Rémunération* : Oui *Restauration *: au frais du candidat avec une subvention *Mission : *Travaux de R&D en extraction de relations dans des documents textuels de renseignement ouvert (état de l'art, création d'un corpus de référence / test, développement d'un système de ER) *Mots-clefs :* #NLP #python #RE #IA Description de la mission La tâche d'extraction de relations est une tâche importante en extraction d'information et consiste à extraire des relations sémantiques entre des entités prédéfinies. Ces relations peuvent être préalablement spécifiées ou ouvertes. Bien qu'il s'agisse d'une tâche classique du domaine du TAL, cette tâche reste un défi et présente encore des difficultés non résolues. Ces difficultés sont souvent liées aux types de relations à extraire, à la nature du texte et aux spécificités des énoncés linguistiques. Dans le cadre de ce stage, il s'agit de d'étudier cette tâche pour des documents spécifiques au domaine du renseignement. L'objectif de ce stage consiste à adapter et évaluer les modèles existants de l'état de l'art pour extraire les relations pertinentes entre entités dans des documents textuels en lien avec le renseignement d'origine source ouverte. Ces travaux viennent en amont de précédents travaux qui ont permis d'extraire les entités pertinentes dans ces documents. Le corpus analysé pourra par exemple être la base publique Renseignor. Les travaux porteront principalement sur les tâches suivantes : - Faire un état de l'art sur les méthodes récentes en extraction de relations ; - Prendre en main / adapter un outil d'annotation manuelle multi-utilisateurs ; - Contribuer à la mise en place d'une petite campagne d'annotation pour construire un corpus annoté ; - Analyser statistiquement les spécificités du corpus d'étude ; - Évaluer les approche les plus pertinentes de l'état de l'art en extraction de relations sur le corpus annoté en se basant sur les métriques standards pour cette tâche ; - Proposer une approche d'extraction de relations adaptée au domaine du renseignement ; - Si le temps le permet, étendre l'approche proposée (nouveau corpus, nouvelle langue...). Les choix des outils et des méthodes seront définis en coordination avec les membres de l'équipe. Description de la structure d'accueil La mission première de la Direction Générale de l'Armement est de fournir aux armées et aux services du ministère des armées les systèmes et outils nécessaires à leurs missions. Le centre Maîtrise de l'Information (DGA MI) assure l'expertise technique en appui de la maîtrise d'ouvrage des systèmes développés par l'industrie pour les armées ou les services du ministère des armées. Dans ce contexte, nous recrutons un.e stagiaire ingénieur.e pour un stage d'une durée de 6 mois sous convention gratifiée. Le/la stagiaire intègre une équipe technique spécialisée en traitement automatique du langage écrit et parlé, implantée sur le site de DGA-MI à Bruz, près de Rennes. Adresse DGA MAÎTRISE DE L'INFORMATION 136 La Roche Marguerite 35170 BRUZ *Candidature* Candidature (CV en français) à soumettre à nihel.kooli@intradef.gouv.fr *Nihel KOOLI* Chargée d'expertise en Traitement Automatique de Langues DGA MI e-mail :* nihel.kooli@intradef.gouv.fr *