Dans le cadre du projet ArchivU, le Ceditec (UPEC) propose un contrat de recherche postdoctoral en TAL et/ou linguistique outillée, d'une durée de 12 mois Le projet ArchivU aborde les transformations récentes de l'université via l'analyse de deux genres de discours : comptes rendus de conseils d'administration et rapports de laboratoire de 1970 à nos jours. Le corpus comprend les comptes rendus de l'université de Nanterre et de l'université Paris Est Créteil, ainsi qu'une sélection de rapports. Le contrat postdoctoral vise à développer un projet de recherche en relation avec l'enrichissement et l'analyse de ce corpus. Dans le cadre de la recherche ArchivU, le postdoctorant /la postdoctorante sera amené à proposer un projet de recherche en relation avec l'enrichissement et l'analyse du corpus ArchivU. La mission consistera à réaliser des tâches variées telles que : - Établissement, structuration, et nettoyage des données correction des sorties OCR et encodage XML) ; - Prise en main/adaptation d'un outil d'annotation manuelle multi-utilisateur et de guides d'annotation - Analyse des données avec une approche en statistiques textuelles - Gestion et documentation des données et (méta)données sur la base d'un protocole préexistant à reproduire ; - Mise en place d'outils de détection automatique à but d'enrichissement du corpus en rapport avec des marqueurs caractéristiques des genres de discours étudiés (type fine-tuning de LLM pour la détection et le balisage linguistique fin) ; - Participation aux activités de publication et communication de l'équipe - Formation des équipes aux méthodes et à l'utilisation des outils. Lieu de travail : La personne recrutée travaillera à l'université de Paris Est Créteil et bénéficiera d'un bureau et d'un poste de travail au sein de l'UFR LLSH. Début du contrat : entre le 1er octobre et le 15 décembre 2024 Rémunération : 2250,35 ¤ net/mois Profil recherché : - doctorat en sciences du langage ou informatique, spécialité traitement automatique des langues ou linguistique outillée ; - compétences en programmation Python pour le TAL(sklearn, Pytorch, Tensoflow...) - expérience de l'annotation pour le TAL (gestion d'une campagne d'annotation) - expérience dans le traitement des fichiers XML - aptitudes à la rédaction et à la présentation de documents académiques ; - maîtrise du français comme langue de travail principale ; - capacité à travailler de manière indépendante, au sein d'une équipe de recherche pluridisciplinaire - capacité à prioriser les tâches, à prendre des initiatives Comment candidater : Les dossiers de candidature doivent comprendre : - les coordonnées de contact (mail, téléphone) ; - un CV actualisé avec une liste de publications ; - une lettre de motivation intégrant des pistes de projet de recherches en lien avec la fiche de poste ; - un texte académique et/ou projet de recherche jugé pertinent. Procédure de candidature : La date limite de dépôt des candidatures est fixée au 20 juin 2024. Le dossier de candidature complet doit être envoyé par e-mail à frederique.sitri@u-pec.fr avec l'intitulé « candidature Post-doc ARCHIVU », en copie à hdumoulin@parisnanterre.fr Les candidatures seront considérées comme complètes lorsque tous les éléments auront été reçus. Procédure de recrutement : Une liste restreinte de candidats présélectionnés sur la base du dossier soumis sera invitée à un entretien qui aura lieu entre le 1er et le 8 juillet 2024. Contact : Les personnes intéressées sont invitées à prendre contact avec Frédérique Sitri (frederique.sitri@u-pec.fr) et Hugo Dumoulin (hdumoulin@parisnanterre.fr)