Contexte

L'identification de données personnelles dans les textes est une étape
essentielle pour répondre aux besoins des entreprises autour des
problématiques de sécurité, offuscation et gouvernance des données.
Le projet DecRIPT (http://tesniere.univ-fcomte.fr/projet-decript) a
pour objectifs de proposer un modèle linguistique-sémantique pour
pouvoir identifier automatiquement les données personnelles dans les
textes en langage naturel.

Mission

La mission principale du (de la) post-doctorant.e sera de participer au
développement d'une librairie logicielle pour le traitement de données
personnelles dans des textes. L'implémentation s'appuiera sur une
méthodologie linguistique (méta-modèle sémantique) développée au sein
du projet DecRIPT, permettant d'automatiser l'identification,
l'annotation, l'offuscation et l'anonymisation de données personnelles.
Le (la) post-doctorant.e contribuera à :
-   l'implémentation informatique de la méthodologie de repérage,
    annotation et offuscation de données personnelles ;
-   le développement des API permettant l'intégration aux logiciels
    d'entreprises ;
-   l'enrichissement des ressources linguistiques et modèles
    sémantiques ainsi que le développement d'interfaces pour leur
    gestion efficace ;
-   l'évaluation du système sur des corpus de données textuelles
    provenant de sources variées.

Candidature

Plus de détails sur le poste sont disponibles sur la page web du projet :
http://tesniere.univ-fcomte.fr/projet-decript/#recrutement

Pour tout renseignement concernant le poste, contactez :
Iana Atanassova ( iana.atanassova@univ-fcomte.fr )
    MdC HDR en Traitement Automatique des Langues,
    responsable du projet DecRIPT
Sylviane Cardey ( sylviane.cardey@univ-fcomte.fr )
    Professeur émérite en Traitement Automatique des Langues,
    coresponsable du projet DecRIPT

Les candidatures (CV avec liste de publications et lettre de
motivation) doivent être envoyées dès que possible par e-mail.