Offre de deux stages post-doctoraux sur le versant littéraire des humanités numériques dans le cadre du Labex OBVIL Date limite du dépôt du dossier le 30/03/2017. Durée 1 an renouvelable Prise de fonction à partir du 15/04/2017 (cette prise de fonction peut être retardée en fonction des contraintes du chercheur) Contacts: Didier ALEXANDRE, Université Paris-Sorbonne, directeur du Labex OBVIL didier.alexandre@paris-sorbonne.fr Jean-Gabriel GANASCIA, UPMC, LIP6, directeur-adjoint du Labex OBVIL jean-gabriel.ganascia@lip6.fr Pour toute demande d'information complémentaire sur les aspects scientifiques, contacter Jean-Gabrie Ganascia Ce poste est destiné à un jeune chercheur en intelligence artificielle qui porte un intérêt aux humanités numériques. Lieux de travail: Université Pierre et Marie Curie, 4 place Jussieu, UMR 7606 Laboratoire d'informatique de Paris 6, et Université Paris-Sorbonne, Maison de la Recherche, rue Serpente, 75005, Paris Soumission des candidatures: les personnes intéressées doivent envoyer avant le 1er février 2016 un CV complet et une lettre de motivation à Jean-Gabriel Ganascia (Jean-Gabriel.Ganascia@lip6.fr) avec une copie et à Didier Alexandre (didier.alexandre@paris-sorbonne.fr) Fonction Développement et validation de logiciels pour les humanités numériques Outils d'indexation de corpus littéraire avec des ontologies Des outils numériques de comparaison de textes, de recherche d'homologies dans les textes, de détection d'entités nommées, d'indexation sémantique, de cartographie de corpus, etc. ont été réalisés ces dernières années dans le cadre de l'équipe ACASA du LIP6 - Université Pierre et Marie Curie et du labex OBVIL. Il s'agit maintenant de les déployer sur de très gros corpus textuels français et anglais fournis par la Bibliothèque Nationale de France et l'université de Chicago (plus de 300000 ouvrages) et de les mettre à disposition d'une communauté large composée non seulement des chercheurs en littérature de l'OBVIL mais aussi de l'ensemble du public intéressé. Le chercheur contribuera au déploiement et à la validation de ces algorithmes sur des corpus conséquents, ce qui pourra passer par leur parallélisation. Il s'agit aussi de les rendre accessible à un public large par une interface web. Compétences requises Etre titulaire d'une thèse d'informatique sur le traitement du langage naturel ou la fouille de masses de données textuelles. Maîtriser : Avoir la capacité à s'intégrer à une équipe de recherche en informatique et montrer un intérêt pour les humanités numériques. - les concepts fondamentaux de l'intelligence artificielle - les techniques de base du traitement de la langue naturelle (étiquetage syntaxique, analyse syntaxique, etc.) - les algorithmes d'apprentissage machine et de fouille de données textuelles, Le Labex OBVIL Le Laboratoire d'excellence OBVIL s'inscrit dans le cadre de la COMUE Sorbonne-Universités et réunit des chercheurs appartenant à 7 équipes d'accueil, à 2 UMR (unités mixtes université/CNRS) et à un programme transversal de l'UMS de la Maison de la Recherche de Paris-Sorbonne. Il regroupe des enseignants-chercheurs et des chercheurs des universités Paris-Sorbonne et Pierre-et-Marie-Curie, les uns spécialistes de littérature, les autres d'informatique, de traitement automatique de la langue naturelle et de fouille de textes. Il entend développer toutes les ressources offertes par l'intelligence artificielle et le traitement de grandes masses de données textuelles (Big Data) pour examiner aussi bien la littérature française du passé que la plus contemporaine. Ouvertures Comme dit plus haut, ce projet se réalisera dans le cadre du Labex OBVIL. Ce Labex entretien des liens privilégié avec la Bibliothèque Nationale de France, qui met à notre disposition un corpus de 130000 ouvrages, et avec le projet ARTFL de l'université de Chicago avec qui nous avons plusieurs échanges dans le cadre d'un projet financé par la fondation Mellon et la FMSH.