Le Laboratoire d'Informatique de Paris-Nord (LIPN, UMR 7030 CNRS -- Université Sorbonne Paris Nord) recrute un·e postdoctorant·e ou ingénieur·e de recherche pour un CDD de 9 mois, démarrage souhaité en décembre 2025 ou janvier 2026, dans le cadre du projet ANR DALiH sur la numérisation du patrimoine linguistique arménien. Thématiques de recherche - Variabilité dialectale et similarité linguistique : modéliser la diversité dialectale dans des langues à ressources limitées (notamment l'arménien), construire des représentations robustes (embedding, alignement inter-variétés), détecter et quantifier la proximité/distance dialectale, et évaluer l'impact de cette variabilité sur les tâches en traitement automatique des langues. - Analyse de documents patrimoniaux, extraction d'informations en contexte d'ordre de lecture complexe, incluant segmentation logique, structuration, post-correction et normalisation textuelle. - Large Language Models en situation de tâches d'annotation et de zero-shot évaluation pour l'analyse linguistique. Profil recherché - Master 2 ou doctorat en informatique, TAL/NLP, machine learning et apprentissage profond ou domaine connexe. - Expérience solide de l'apprentissage automatique et profond (PyTorch). Environnement Poste basé au LIPN-CNRS (Villetaneuse), au sein de l'équipe RCLN (Représentation des Connaissances et Langage Naturel), avec partenaires à l'INALCO et à l'École Nationale des Chartes -- PSL. Candidature Envoyer un CV (avec liste de publications) et des exemples de travaux (prépublications, dépôt GitHub, etc.). Contact : nadi.tomeh@lipn.univ-paris13.fr