------------------------------------------------------------------------ PROPOSITION DE CONTRAT POST-DOCTORAL : Apprentissage automatique et annotation syntaxique pour la caractérisation de segments injonctifs et de relations temporelles ------------------------------------------------------------------------ Les labotatoires LIFO (U. d'Orléans) et LIFAT (U. Tours, site de Blois) mènent des recherches dans le domaine du Traitement Automatique des Langues Naturelles dans le cadre de leurs équipes respectives "Contraintes et Apprentissage" (CA) et "Bases de Données et Traitement Automatique des Langues" (BDTLN). Ils recrutent un ingénieur de recherche dans le cadre de deux projets financés par la région Centre Val de Loire, auxquels sont également associés le Laboratoire Ligérien de Linguistique (LLL) et le laboratoire PRISME. Le projet RAVIOLI est une action de recherche pluridisciplinaire qui réunit des linguistes, des talistes et des spécialistes du traitement du signal autour de la problématique des énoncés injonctifs dans le dialogue oral interactif. Le projet vise à terme une caractérisation automatique des types d'énoncés injonctifs, suivant une modélisation linguistique en cours d'élaboration. Pour cela, les partenaires proposent de s'appuyer sur une caractérisation à la fois prosodique, syntaxique et sémantico-pragmatique, pour parvenir à une discrimination des énoncés par apprentissage automatique. Le travail attendu dans le cadre de ce contrat concerne spécifiquement la caractérisation syntaxique des énoncés injonctifs. Il rejoint les préoccupations d'un autre projet réunissant le LIFAT et le LIFO et qui porte sur la détection automatique de relations temporelles toujours dans l'oral interactif. Dans ce cadre, nous avons développé un outil d'annotation de corpus arborés qui, partant de sorties adaptées à l'oral du Stanford Paser, permet une annnotation des relations temporelles directement sur les arbres syntaxiques. Le corpus réalisé dans ce cadre servira de base d'apprentissage pour un système de détection automatique des relations temporelles, qui sera partie intégrante des missions demandées à la personne recrutée. * MISSION ------------------------------------------------------------------------ Un outil (Contemplata) d'annotation de corpus arborés a déjà été développé par les laboratoires LIFAT et LIFO dans le cadre du projet ODIL. Développé dans le paradigme fonctionnel (Haskell en back-end et EML en front-end), cet outil demande toutefois quelques développements pour parfaire son opérationnalité. Une première mission pour la personne recrutée sera l'évolution de Contemplata pour l'adapter aux besoins du projet RAVIOLI : amélioration de la révision des arbres créés et de leur annotation en relations temporelles, repérage et caractérisation des énoncés injonctifs, prise en charge en entrée de corpus annotés avec Elan La seconde mission portera sur le développement d'un système de détection automatique des relations temporelles faisant appel à un apprentissage automatique sur le corpus ODIL. *ACTIVITÉS PRINCIPALES ------------------------------------------------------------------------ - T0 - T0+3 - Réingéniérie du code actuel de Contemplata : finalisation de l'interface d'annotation en relations temporelles (annotation sémantique sur les arbres syntaxiques), amélioration de la partie administration d'une campagne d'annotation, prise en charge du format Elan en entrée, développement de capacités d'annotation spécifiques aux injonctions - T0+3 - T0+6 - Discrimination des structures syntaxiques utiles au repérage des injonctions, par exploration de données en corpus et travail sur la sélection des traits utiles en apprentissage - T0+3 - T0+6 - Participation à la finalisation du corpus arboré ODIL annoté en relations temporelles : participation à la réflexion scientifique sur un format d'annotation adapté d'ISO TimeML / French Time Bank - T0+3 - T0+12 - Développement et optimisation d'un système de détection et de classification automatiques des relations temporelles. Cet outil fera appel à des techniques d"apprentissage automatique dont la nature exacte sera défini avec la personne recrutée. * REMUNERATION ET CONDITIONS D'EXERCICE ------------------------------------------------------------------------- - La personne recrutée prendra ses fonctions en février 2019. La durée de recrutement sera de 12 mois - Elle s'intégrera dans une équipe projet réunissant les laboratoires LIFAT et LIFO, dans le cadre de deux CDDs successifs de 6 mois de durée portés par chacun des 2 laboratoires. Toutefois, le lieu d'exercice de l'activité sera, au choix de la personne recrutée, la ville de Blois ou la ville d'Orléans sur la durée de la mission. - Le niveau de recrutement sera celui d'un ingénieur de 2° classe 5° échelon, soit 1916 Euros/net par mois (coût 2017 à actualiser). * PROFIL RECHERCHE ------------------------------------------------------------------------ La personne recherchée sera titulaire d'un doctorat en informatique dans le domaine du traitement automatique des langues, ou à défaut aura soutenu une thèse en sciences du langage mais disposera de compétences informatiques solides lui permettant de mener à bien les missions d'ingénierie logicielle qui lui seront confiées. Avoir une expérience dans le domaine de l'apprentissage automatique sera un plus apprécié, mais nous sommes également à la recherche d'une personne qui dispose d'un intérêt marqué pour le fait linguistique (niveaux syntaxiques et sémantiques en particulier), et qui sera à même de collaborer avec les collègues linguistiques du laboratoire LLL. * CONTACT - DEPOT DE CANDIDATURE ------------------------------------------------------------------------ Les personnes intéressées sont invitées à contacter les deux responsables scientifiques de cette action de recherche : - Anaïs Lefeuvre-Halftermeyer (LIFO, anais.halftermeyer@univ-orleans.fr) - Jean-Yves Antoine (LIFAT, Jean-Yves.Antoine@univ-tours.fr) Le dépôt de candidature se feront auprès de ces deux personnes, sur la forme d'un curriculum long résumant vos activités de recherche, d'une lettre de motivation et éventuellement de lettres de recommandation. * Date limite de réception des dossiers : 4 janvier 2019 Sélection des * dossiers pour un entretien : 7 janvier 2019 Entretiens et décision : * semaine du 14 janvier 2019. Démarrage du contrat : 4 février 2019.