*Vers un Biocontrôle Efficace: Extraction Automatique des Résultats expérimentaux de la littérature scientifique * */Towards Effective Biocontrol: Automatic Extraction of Experimental Results from Scientific Literature/* *Lieu*: unité MaIAGE, Centre de recherche INRAE de Jouy en Josas *Durée*: 5 à 6 mois entre février et août 2026 *Contacts: * - Claire Nédellec (équipe Bibliome, unité MaIAGE, INRAE https://maiage.inrae.fr/), Jouy-en-Josas. claire.nedellec@inrae.fr - Thomas Presseq, société Syndev https://syndev.fr/ thomas.pressecq@inrae.fr *Sujet* Ce stage s'inscrit dans le projet /OAD Succes - Outil d'Aide à la Décision pour Favoriser l'usage et le Succès de Biosolutions pour la Santé des Plantes/. Les produits de biocontrôle sont des produits d'origine naturelle développés pour diminuer et remplacer les pesticides de synthèse pour des cultures plus respectueuses de l'environnement. Au-delà de leur formulation, les conditions d'applications (dose, fréquence, mode d'administration) et les facteurs environnementaux (humidité, température) jouent un rôle déterminant dans l'efficacité des traitements dans la lutte contre les pathogènes des plantes cultivées et en conséquence dans l'adoption de technologies de biocontrôle par les agriculteurs. Les données expérimentales des essais sont rapportées dans la littérature scientifiques et des rapports sous des formes diverses, textes libres, figures ou tableaux. L'objectif de ce stage est le développement de méthodes d'extraction automatique d'information à partir de textes basées sur l'apprentissage automatique (/machine learning/) pour enrichir la base de connaissance sur le biocontrôle afin de contribuer à l'application d'accompagnement des agriculteurs développée par la société SYNDEV. Les méthodes mises en oeuvre par le stagiaire devront tirer parti d'un ensemble restreint d'exemples annotés manuellement, ainsi que des ressources expertes déjà disponibles. L'enjeu est de concevoir des approches efficaces même en contexte de données limitées, tout en assurant la qualité et la fiabilité des informations extraites. Les modèles de langue seront évalués en comparaison avec les informations extraites manuellement. Les conclusions du stage incluront une analyse des verrous et des solutions prometteuses. *Profil* - Master 2 en informatique ou bioinformatique orienté Traitement Automatique des Langues et/ou Apprentissage automatique - Expérience en application et entraînement de modèle de langue - Expérience en TAL et/ou utilisation de la bibliothèque HuggingFace - Maîtrise de l'anglais ou français courant. - Compétences techniques requises : Python et/ou Java - Intérêt pour la biologie et le travail interdisciplinaire. ** Les candidatures (CV, lettre de motivation, et relevé de notes L3, M1 and M2) sont à envoyer à claire.nedellec@inrae.fr Elles seront examinées au fil de l'eau. En savoir plus: https://maiage.inrae.fr/node/3469