Offre d'emploi Post-doctoral : RELText, extraction de relations à partir de textes _Descriptif du poste_ Le développement de*méthodes d'extraction de relations* sémantiques à partir de textes repose jusqu'ici sur des approches exploitant des indices syntaxiques et lexicaux au sein d'une phrase, et cela soit à l'aide de patrons, soit par des analyses statistiques. L'apprentissage automatique permet d'accélérer la mise au point de ces logiciels ou d'améliorer les techniques d'extractions. Nous proposons un contrat post-doctoral afin d'évaluer la complémentarité de plusieurs approches d'extraction de relations sur un même corpus. Pour cela, il s'agira d'adapter des logiciels développés au sein de l'équipe d'accueil MELODI pour les utiliser sur les corpus de la collection ISTEX, d'en faciliter la diffusion et d'en caractériser les performances sur ces corpus. Par ailleurs, la mise en forme des textes, telle qu'elle peut être perçue dans les fichiers PDF, est jusqu'ici peu exploitée, alors que les travaux menés dans MELODI sur les énumérations verticales sont très prometteurs. Une deuxième activité portera donc sur la *définition de techniques s'appuyant sur d'autres indices visuels ou de structure* comme moyen de repérer des relations sémantiques. A partir de là, il s'agira de définir et implémenter de nouveaux extracteurs de relations exploitant à la fois les fichier pdf et les fichiers texte structurés par des balises. Enfin, *la complémentarité* entre ces différentes techniques sera étudiée en identifiant, parmi les relations pouvant être extraites par chacune, celles trouvées par une seule approche ou les recoupements, et de voir comment les résultats de certaines techniques permettent d'enrichir d'autres techniques. Ces résultats seront comparés à des approches de référence en vue de leur publication. _Profil recherché_ Titulaire d'un doctorat en informatique dans le domaine du traitement automatique des langues, de l'apprentissage automatique, de l'ingénierie des connaissances et/ou du web sémantique, avec de fortes compétences en développement informatique. Des connaissances de bon niveau en représentation de connaissances seraient un plus très apprécié. Compétences en programmation requises : Java et Perl, Python. Anglais et français : lu, écrit. _Conditions_ Le poste est basé à l'IRIT à Toulouse. Salaire selon l'expérience et suivant la grille de la fonction publique utilisée à l'université de Lorraine. Cet emploi donnera lieu à des publications et peut être considéré comme une formation postdoctorale pour les titulaires de doctorat. _Coordonnées de la personne à contacter : _ Nathalie Aussenac-Gilles - Equipe MELODI - IRIT (Toulouse) https://www.irit.fr/-Equipe-MELODI- Email : aussenac@irit.fr Tel : 05 61 55 82 93