Contexte L'identification de données personnelles dans les textes est une étape essentielle pour répondre aux besoins des entreprises autour des problématiques de sécurité, offuscation et gouvernance des données. Le projet DecRIPT (http://tesniere.univ-fcomte.fr/projet-decript) a pour objectifs de proposer un modèle linguistique-sémantique pour pouvoir identifier automatiquement les données personnelles dans les textes en langage naturel. Mission La mission principale du (de la) post-doctorant.e sera de participer au développement d'une librairie logicielle pour le traitement de données personnelles dans des textes. L'implémentation s'appuiera sur une méthodologie linguistique (méta-modèle sémantique) développée au sein du projet DecRIPT, permettant d'automatiser l'identification, l'annotation, l'offuscation et l'anonymisation de données personnelles. Le (la) post-doctorant.e contribuera à : - l'implémentation informatique de la méthodologie de repérage, annotation et offuscation de données personnelles ; - le développement des API permettant l'intégration aux logiciels d'entreprises ; - l'enrichissement des ressources linguistiques et modèles sémantiques ainsi que le développement d'interfaces pour leur gestion efficace ; - l'évaluation du système sur des corpus de données textuelles provenant de sources variées. Candidature Plus de détails sur le poste sont disponibles sur la page web du projet : http://tesniere.univ-fcomte.fr/projet-decript/#recrutement Pour tout renseignement concernant le poste, contactez : Iana Atanassova ( iana.atanassova@univ-fcomte.fr ) MdC HDR en Traitement Automatique des Langues, responsable du projet DecRIPT Sylviane Cardey ( sylviane.cardey@univ-fcomte.fr ) Professeur émérite en Traitement Automatique des Langues, coresponsable du projet DecRIPT Les candidatures (CV avec liste de publications et lettre de motivation) doivent être envoyées dès que possible par e-mail.