Lieu: entre le LIPN (Université Sorbonne Paris Nord) et l'ISIR (Sorbonne Université) Durée: 5 à 6 mois Période: à partir de février ou mars 2026 Contexte et objectifs Ce stage s'inscrit dans la continuité des travaux récents sur l'identification d'entités à partir des représentations internes des grands modèles de langage (LLMs), notamment le travail Efficient Entity Mention Detection from Large Language Models (https://arxiv.org/abs/2510.19410). Ces travaux ont montré qu'un petit module (~300k paramètres) peut exploiter efficacement les représentations internes d'un LLM pour détecter les mentions d'entités, obtenant d'excellentes performances en zero-shot (sans supervision spécifique au domaine). L'objectif général du stage est d'explorer comment réduire la quantité de supervision nécessaire pour maintenir des performances élevées et comment utiliser les représentations internes des LLMs pour d'autres tâches liées aux entités : détection et désambiguïsation d'entités, entity linking, résolution de coréférences, ou encore adaptation rapide à de nouveaux domaines. Le stage peut être orienté selon le profil et les intérêts du·de la candidat·e : - vers des aspects expérimentaux (entraînement de modèles légers, exploration de techniques de distillation ou de transfert), - vers des questions méthodologiques (analyse des représentations internes des LLMs, compréhension des signaux de supervision implicite), - ou encore vers des applications concrètes (intégration dans des systèmes d'extraction d'information ou d'assistants intelligents). Ce travail s'inscrit dans une collaboration entre le LIPN (https://lipn.univ-paris13.fr/) l'ISIR (https://www.isir.upmc.fr/equipes/mlia/) et l'IRIT (https://www.irit.fr/) sur l'apprentissage efficace à partir des LLMs pour l'extraction de l'information, visant à concevoir des modèles plus légers et adaptatifs. Profil recherché - Étudiant·e en Master 2 ou école d'ingénieur en informatique, IA, NLP, machine learning, etc. - Bonnes connaissances en deep learning et Python (PyTorch, etc.). Candidature Envoyer un CV, une lettre de motivation (ou un court message décrivant vos intérêts de recherche) et vos relevés de notes à : nadi.tomeh@lipn.univ-paris13.fr morand@isir.upmc.fr Les candidatures seront examinées au fil de l'eau.