Offre de deux stages post-doctoraux sur le versant littéraire des
humanités numériques dans le cadre du Labex OBVIL
 
Date limite du dépôt du dossier le 30/03/2017.
Durée 1 an renouvelable
Prise de fonction à partir du 15/04/2017 (cette prise de fonction peut
être retardée en fonction des contraintes du chercheur)
  
Contacts:
Didier ALEXANDRE, Université Paris-Sorbonne, directeur du Labex OBVIL
didier.alexandre@paris-sorbonne.fr

Jean-Gabriel GANASCIA, UPMC, LIP6, directeur-adjoint du Labex OBVIL
jean-gabriel.ganascia@lip6.fr

Pour toute demande d'information complémentaire sur les aspects
scientifiques, contacter Jean-Gabrie Ganascia

 
Ce poste est destiné à un jeune chercheur en intelligence artificielle
qui porte un intérêt aux humanités numériques.
 
Lieux de travail: Université Pierre et Marie Curie, 4 place Jussieu, UMR
7606 Laboratoire d'informatique de Paris 6, et Université
Paris-Sorbonne, Maison de la Recherche, rue Serpente, 75005, Paris

Soumission des candidatures: les personnes intéressées doivent envoyer
avant le 1er février 2016 un CV complet et une lettre de motivation à
Jean-Gabriel Ganascia (Jean-Gabriel.Ganascia@lip6.fr) avec une copie et
à Didier Alexandre (didier.alexandre@paris-sorbonne.fr)

 
Fonction
Développement et validation de logiciels pour les humanités numériques

Outils d'indexation de corpus littéraire avec des ontologies

Des outils numériques de comparaison de textes, de recherche
d'homologies dans les textes, de détection d'entités nommées,
d'indexation sémantique, de cartographie de corpus, etc. ont été
réalisés ces dernières années dans le cadre de l'équipe ACASA du LIP6 -
Université Pierre et Marie Curie et du labex OBVIL.

Il s'agit maintenant de les déployer sur de très gros corpus textuels
français et anglais fournis par la Bibliothèque Nationale de France et
l'université de Chicago (plus de 300000 ouvrages) et de les mettre à
disposition d'une communauté large composée non seulement des chercheurs
en littérature de l'OBVIL mais aussi de l'ensemble du public
intéressé. Le chercheur contribuera au déploiement et à la validation de
ces algorithmes sur des corpus conséquents, ce qui pourra passer par
leur parallélisation. Il s'agit aussi de les rendre accessible à un
public large par une interface web.


Compétences requises

Etre titulaire d'une thèse d'informatique sur le traitement du langage
naturel ou la fouille de masses de données textuelles.

Maîtriser :

Avoir la capacité à s'intégrer à une équipe de recherche en informatique
et montrer un intérêt pour les humanités numériques.

- les concepts fondamentaux de l'intelligence artificielle

- les techniques de base du traitement de la langue naturelle
  (étiquetage syntaxique, analyse syntaxique, etc.)

- les algorithmes d'apprentissage machine et de fouille de données
  textuelles,

Le Labex OBVIL
Le Laboratoire d'excellence OBVIL s'inscrit dans le cadre de la COMUE
Sorbonne-Universités et réunit des chercheurs appartenant à 7 équipes
d'accueil, à 2 UMR (unités mixtes université/CNRS) et à un programme
transversal de l'UMS de la Maison de la Recherche de Paris-Sorbonne. Il
regroupe des enseignants-chercheurs et des chercheurs des universités
Paris-Sorbonne et Pierre-et-Marie-Curie, les uns spécialistes de
littérature, les autres d'informatique, de traitement automatique de la
langue naturelle et de fouille de textes.

Il entend développer toutes les ressources offertes par l'intelligence
artificielle et le traitement de grandes masses de données textuelles
(Big Data) pour examiner aussi bien la littérature française du passé
que la plus contemporaine.


Ouvertures
Comme dit plus haut, ce projet se réalisera dans le cadre du Labex
OBVIL. Ce Labex entretien des liens privilégié avec la Bibliothèque
Nationale de France, qui met à notre disposition un corpus de 130000
ouvrages, et avec le projet ARTFL de l'université de Chicago avec qui
nous avons plusieurs échanges dans le cadre d'un projet financé par la
fondation Mellon et la FMSH.