# Contexte L'équipe de recherche ENP-China recherche un ingénieur en TAL. Le projet ERC ENP-China (https://www.enpchina.eu) est un projet de recherche en "Humanités Numériques" qui vise à étudier la mutation des élites en Chine entre le 19ème et le 20ème siècle sur la base d'une grande quantité de données, en particulier textuelles, en chinois et en anglais de cette période. L'identification automatique des individus et des organisations/institutions mentionnées dans les textes historiques -- notamment dans la presse -- est essentielle pour traiter le volume de données disponibles. Différents modèles de reconnaissance d'entités nommées ont déjà été adaptés au sein de notre équipe et sont activement utilisés sur nos données. Cependant, cette approche ne permet pas l'identification précise des entités extraites. Le travail de l'ingénieur recruté portera sur le développement d'un système de liage d'entités nommées permettant de relier les entités nommées trouvées dans les textes historiques avec différentes bases de connaissances : MCDB (https://bookdown.enpchina.eu/mcbd_usermanual/), Wikidata, Baidu Baike... En outre, il sera également nécessaire de lier (avec un identifiant unique) les entrées dans différentes bases de connaissances sur les mêmes personnes ou organisations. Par ailleurs, d'autres tâches NLP seront mises en oeuvre, telles que la re-segmentation et/ou la classification des articles de la presse anglaise et chinoise. # Le poste - Contrat : CDD à temps plein de 6 mois (pouvant être prolongé) - Date de début : Dès que possible - Salaire brut : 3100¤ par mois - Lieu : Aix-en-Provence L'employeur est Protisvalor / Aix-Marseille Université # Missions - Mettre en place un système de liage d'entités nommées adapté à nos bases de données et de connaissances. - Intégrer ce système à notre infrastructure existante (en collaboration avec les autres membres de l'équipe). - Mettre en place un système de segmentation d'articles adapté aux besoins et aux données des historiens. - Aider et conseiller les historiens de l'équipe afin de résoudre les problèmes où le NLP pourrait être une solution. # Qualifications et exigences - Avoir un master/diplôme d'ingénieur en TAL ou en Apprentissage Automatique. - Bonnes compétences en Python et bonne connaissance des bibliothèques NLP/ML couramment utilisées (PyTorch et/ou Tensorflow, SpaCy, Transformers, ...). - Une bonne maîtrise de Linux est requise. - Une bonne maîtrise de l'anglais est requise. Le français et le chinois ne sont pas requis. - Capacité à s'organiser efficacement et à travailler dans une équipe orientée vers l'internationale. # Candidature Envoyez CV et lettre de motivation par courriel à christian.henriot@univ-amu.fr et jeremy.auguste@univ-amu.fr