Contrat Post-doctoral : Résumé automatique des datasets de multigraphes à partir de machine reading abstractif Contact: Aldo Gangemi Adresse du responsable: aldo.gangemi@lipn.univ-paris13.fr Université: Université Paris 13 Niveau: chercheur postdoctorant Durée: 12 mois Salaire: 3000 euros brut par mois (approx 2350 net) Spécialités: Machine Reading, Semantic Web, Raisonnement hybride, Fouille des graphes Date limite de candidature: 31-12-2015 Adresse pour la candidature: brigitte.gueveneux@lipn.univ-paris13.fr ; aldo.gangemi@lipn.univ-paris13.fr Référence de candidature: Axe5/CSA/postdoc/2016 Le LabEx EFL (Empirical Foundations of Linguistics) offre un contrat post-doctoral d'une durée de 12 mois sur "Résumé automatique des datasets de multigraphes à partir de machine reading abstractif". Contexte : Le Machine Reading [1] effectue l'extraction d'information à partir du texte d'une manière extractive, à domaine ouvert et unsupervised. Lorsqu'il est appliqué dans un contexte de Web sémantique [2], il conçoit et représente la connaissance extraite sous forme de multigraphes de connaissances formels qui sont liés à des ensembles de données existantes, donc il va générer une variété de machine reading "abstractif" [6]. Un exemple d'outil implémenté pour le Semantic Web Machine Reading (SWMR) est FRED [3],[4]. Dans le volet Computational Semantic Analysis du LabEx EFL (Fondements Empiriques de la Linguistique), nous voulons étendre SWMR vers une maching reading "quasi-humain", qui traite de tâches de haut niveau tels que le résumé de multigraphes, le grounding contextuel, la deep type coercion, la résolution des co-références fondée sur la connaissance, etc.). Objectif : L'objectif principal du candidat postdoctoral est de concevoir et implémenter une extension de SWMR pour le résumé de datasets de multigraphes, et de l'évaluer dans un cas d'utilisation pour SWMR sensible au contexte. Description du projet : La recherche postdoctorale se concentrera sur : - Étudier comment des méthodes formelles et statistiques (par exemple le deep learning) peuvent être hybridées pour étendre le SWMR - Implémenter la méthode par l'évolution des outils de SWMR existants au LIPN - Tester / évaluer / affiner la méthode implémentée Lieu de travail : Le lieu de travail est le LIPN laboratoire d'informatique de l'Université Paris 13, en collaboration avec d'autres partenaires du projet Labex EFL. Personnes de référence dans le projet sont Aldo Gangemi (advisor), Davide Buscaldi et Nadi Tomeh, tous de l'équipe RCLN (Représentation de connaissances et langage naturel) du LIPN. Requis : - Doctorat en informatique, linguistique computationnelle, ou similaire. Doctorants diplômés en début 2016 peuvent postuler - Bon dossier de publications - Maîtrise orale et écrite en anglais - Compétence dans l'extraction d'information à partir du texte - Compétence en ingénierie de la connaissance, de préférence avec les langages et les technologies du Web Sémantique Autres compétences utiles : Semantic parsing Conception / implémentation de technologies sémantiques Expérience avec des grand datasets de graphes Fouille de multigraph Programmation Web Sémantique formelle du langage naturel Compétences sociales, passion pour la recherche et créativité Expérience dans des projets de recherche internationaux Pour candidater, nous vous remercions d'avance de nous envoyer par courriel : - un CV comportant une liste des publications - le nom de deux référents (avec adresse mail) que le comité de recrutement pourra consulter - un résumé de la thèse doctorale - (facultatif, mais bien accueilli) un esquisse de projet de recherche (3 pages max avec des éléments originaux) décrivant au moins un approche au résumé automatique abstractif, avec une ébauche de bibliographie Date limite des candidatures : 31 décembre 2015 Auditions des candidats pré-séléctionnés : début janvier 2016 Date de prise de fonctions souhaitée : 1er février 2016 Salaire : 3000 euros brut par mois (approx 2350 net) Contacts pour la candidature : brigitte.gueveneux@lipn.univ-paris13.fr ; aldo.gangemi@lipn.univ-paris13.fr Références : [1] Oren Etzioni, Michele Banko, Michael J. Cafarella. Machine Reading. Proceedings of AAAI2006 [2] Aldo Gangemi. A Comparison of Knowledge Extraction Tools for the Semantic Web. Proceedings of ESWC2013, LNCS, Springer, 2013 [3] http://wit.istc.cnr.it/stlab-tools/fred [4] Valentina Presutti, Francesco Draicchio and Aldo Gangemi. Knowledge extraction based on Discourse Representation Theory and linguistic frames. Proceedings of EKAW2012, LNCS, Springer, 2012. [5] http://www.labex-efl.org/?q=en/research/strand5 [6] D. R. Radev, E. Hovy, and K. McKeown. Introduction to the special issue on summarization. Computational Linguistics, 28(4), 2002.