Poste ouvert à ALPAGE (Inria et Université Paris-Diderot) dans le cadre du projet RAPID "VerDI" (porteur: entreprise TrooClick; autre partenaire: ALPAGE, sous-traitant: entreprise Ektimo) ------------------------------------------------------------------------ Description du projet ------------------------------------------------------------------------ Le projet VerDI et centré sur l'identification automatisée des dissimulations d'informations sur Internet et les réseaux sociaux. De telles dissimulations peuvent être produites par l'omission d'éléments significatifs dans des documents ou lors d'échanges écrits, ou d'autres méthodes comme le fait de fausser une donnée, ou la cacher parmi un flux parasite. VerDI vient compléter un outil de contrôle de véracité de l'information publiée dans la presse en ligne, déjà existant et développé par la société Trooclick, porteur du projet. À l'issue du projet, aura été développé un démonstrateur d'identification automatisée des dissimulations dans les reprises de communiqués de presse par les media, qui traitera des données en français et en anglais. Ce démonstrateur devra s'appuyer sur différentes techniques de traitement automatique des langues et de modélisation de l'information, y compris une analyse sémantique à la FrameNet qui s'appuiera pour le français sur les résultats du projet ANR ASFALDA dont ALPAGE est porteur. ------------------------------------------------------------------------ Description générale du poste ------------------------------------------------------------------------ Le post-doc recruté pour 2 ans aura pour mission de traiter l'ensemble des aspects faisant appel au traitement automatique des langues au sein du projet (études théoriques, conception, développement, évaluation). Un descriptif détaillé de son rôle au sein de chacune des tâches en lesquelles le projet est structuré est est donné ci-dessous. La personne recrutée sera responsable du projet VerDI au sein d'ALPAGE pour tous ses aspects (scientifiques, de développement, administratifs, préparation des livrables, publications scientifiques). Il collaborera avec les autres membres d'Alpage au fil des besoins, mais sera en charge de la participation d'ALPAGE à VerDI de façon autonome. ------------------------------------------------------------------------ Description détaillée du poste au sein du projet ------------------------------------------------------------------------ Tâche 1: Étude théorique préalable Rôle: participation comme responsable de tâche à la réalisation de l'étude et à la rédaction d'un rapport décrivant l'état de l'art, en collaboration avec l'entreprise Trooclick (1 mois) Tâche 2: Complément sur les besoins potentiels militaires et civils Pas de rôle prévu concernant cette tâche Tâche 3: Faisabilité et expérimentation de plusieurs approches de Traitement Automatique des Langues pour l'identification et l'interprétation des omissions: - Approche orientée extraction d'informations et comparaisons entre documents: comparaison automatique avec d'autres articles sur le même sujet (spécialité de Trooclick) - Approche orientée fact checking: comparaison avec un modèle du domaine (spécialité de Trooclick) - Approche orientée analyse sémantique, notamment par l'exploitation des outils et ressources de type FrameNet développés pour le français par le projet ANR ASFALDA, dont Alpage et porteur - Approche orientée analyse de surface par détection de marqueurs d'incertitude (Vincze, 2013), y compris en faisant usage d'analyseurs syntaxiques tels que ceux développés à Alpage - Approche hybride (combinaison des approches précédentes) Rôle: Participation comme responsable de tâche au développement et à la livraison d'un logiciel ouvert implémentant les différentes approches et d'un livrable décrivant ce logiciel et son fonctionnement, en collaboration avec l'entreprise Trooclick. Le post-doc se concentrera plus particulièrement sur les trois dernières approches (11 mois) Tâche 4: Réalisation d'un démonstrateur pour démontrer la faisabilité d'un système de détection et interprétation de dissimulation d'informations Rôle: Développement en collaboration avec l'entreprise TrooClick d'un démonstrateur sur le cas d'usage retenu, à savoir l'analyse des reprises par les médias des informations publiées par une organisation dans un Communiqué de Presse, ou toute autre forme de communication du même type. Tâche 5: Présentation du démonstrateur aux utilisateurs pilotes, évaluation, conclusions et perspectives Rôle: Participation à la tâche, réalisée principalement par l'entreprise Trooclick, tâche dont les résultats sont fournis sous la forme d'un document regroupant les résultats des tests, des évaluations, et décrivant les conclusions et perspectives du projet VerDI. ------------------------------------------------------------------------- Compétences et conditions ------------------------------------------------------------------------- * Thèse de doctorat en traitement automatique des langues ou dans un domaine apparenté * Solides compétences traitement du langage naturel (TAL) * Idéalement, compétence dans un des domaines du TAL mis en oeuvre dans le projet (analyse sémantique automatique, notamment) * Solides compétence en programmation dans au moins l'un des langages suivants: Python, Perl, C, C++, Java * Connaissance de l'environnement UNIX * Capacité à travailler en équipe, y compris au sein d'une collaboration entre milieux académique et industriel * Autonomie et sens des responsabilités * Excellente maîtrise du français (langue de travail) * Bonne maîtrise de l'anglais (le post-doc devra travailler sur des données en français et en anglais) Rémunération : Selon grille de la fonction publique (Inria) Date de prise de fonction : 01/11/2015 (ou 01/12/2015) Durée : 24 mois à temps plein Lieu de travail: ALPAGE, UFR de linguistique de l'Université Paris-Diderot, place Paul Ricoeur, 75013 Paris Merci de faire parvenir CV et lettre de motivation à Benoît Sagot, au plus tard le 18 septembre 2015, à l'adresse suivante: benoit.sagot (chez) inria.fr