*Offre de postdoc *: "Évaluation et biais de grands modèles de langue multimodaux inclusifs pour le français" *Durée* : 13 mois *Financement* : Projet ANR Pantagruel http://pantagruel.imag.fr *Description de l'offre* : nous proposons un contrat post-doctoral (13 mois) financé par l'ANR Pantagruel, sur l'évaluation de grands modèles de langue, de type masqué et de type causaux, mono- et multi-modaux (modalités texte, audio, pictogrammes). Outre l'utilisation de jeux d'évaluation existants, le sujet peut prendre diverses directions, à choisir selon le profil/goût de la personne recrutée: - biais : mesures de biais dans les corpus d'entraînement, de leur amplification ou atténuation dans les modèles résultants; techniques de réduction des biais - application de LLMs à des recherches de sciences sociales - évaluation de LLMs pour le domaine biomédical *Encadrants* : Marie Candito, Etienne Ollion (pour des recherches en sciences sociales), Lorraine Goeuriot (pour applications biomédicales) Langue cible des modèles : français *Localisation* : possibilité d'être basé à Paris (LLF - Paris 13e), ou Grenoble (LIG) Télétravail possible. *Environnement technique* : module transformers d'HF, écriture / lancement de scripts d'évaluation de LLMs sur supercalculateur (Adastra). *Contact *: pour plus de renseignements/détails sur cette offre : marie.candito@u-paris.fr *Début du contrat* : dès que possible à partir d'octobre 2024 *Candidatures* : envoyez lettre de motivation, CV académique et lettres de recommandation à marie.candito@u-paris.fr *Contexte* : le projet Pantagruel (http://pantagruel.imag.fr) : "Développement de Modèles de Langue Multimodaux Inclusifs pour le Français." Le projet Pantagruel est une initiative ambitieuse visant à repousser les limites de la compréhension et de l'utilisation du langage en développant des modèles de langue multimodaux (écrit, oral, pictogrammes) et inclusifs pour la langue française. Ce projet novateur s'appuie sur l'expertise de chercheurs issus de différentes disciplines telles que l'informatique, le traitement du signal, la sociologie et la linguistique, afin d'assurer une diversité de points de vue et garantir la fiabilité et la pertinence des résultats. Le Laboratoire d'Informatique de Grenoble coordonne ce projet qui implique plusieurs laboratoires francophones (LIG, Grenoble ; LIA, Avignon ; CREST, Palaiseau ; INA , Bry-sur-Marne ; LLF, Paris) et quelques dizaines de chercheurs.