*Contexte* : Le post-doc s'inscrit dans le projet industriel VOCAGEN. Ce projet de 26 mois a pour objectif de permettre la saisie intuitive d'informations en contexte de mobilité (sur des terminaux type tablette ou smartphone). L'objectif du post-doc est la proposition et la mise en place d'algorithmes permettant l'acquisition de connaissances à partir de données textuelles de domaines métiers. Ces connaissances seront modélisées sous la forme d'ontologies afin permettre leur intégration dans les outils des partenaires industriels du projet VOCAGEN. Ces outils permettent entre autre la mise en oeuvre d'un dialogue homme-machine en langue française qui à terme devra permettre la saisie automatique d'informations sur des terminaux mobiles. *Sujet* : Les travaux à mener s'inscrivent principalement dans le contexte de l'Ontology Learning. Les différentes tâches envisagées peuvent être décomposées comme suit. La première tâche du post-doctorant consiste en la réutilisation et le test de techniques et outils fournis par les partenaires du projet VOCAGEN afin d'en maitriser le fonctionnement et les besoins d'intégration. La deuxième tâche consiste à proposer (ou adapter) un outil permettant l'extraction de concepts à partir de données textuelles tels que des corpus d'énoncés recueillis en situation par les partenaires ou encore des données recueillies sur le Web. Des expériences intermédiaires pourront être menées en utilisant l'anglais mais, l'outil devra fonctionner pour des données textuelles en français. Une amélioration significative par rapport à l'état de l'art est attendue pour l'extraction de concepts. La troisième tâche concerne l'extraction de patrons lexico-syntaxiques qui s'appuie sur la proposition ou la modification d'algorithmes d'extraction de motifs ou de patrons dans les données textuelles. Cette tâche permettra à termes d'améliorer les techniques existantes pour l'acquisition de relations (ad-hoc ou connues a priori, comme les relations taxonomiques ou de composition) entre les concepts. Finalement, la modélisation des connaissances extraites sera faite sous forme d'ontologie. Par ailleurs, tout au long du travail, il sera nécessaire de valider les différents algorithmes proposés en se comparant d'une part à l'existant ou encore en utilisant un corpus annoté. Ainsi, une tâche à mener en parallèle consistera à produire un tel corpus, notamment avec l'appui des partenaires industriels du projet, afin de permettre la mise en oeuvre d'un protocole d'évaluation des outils et des algorithmes proposés. *Compétences* *souhaitées* : Le profil recherché est un docteur en Informatique, possédant des compétences en : - Ontology Learning, - fouille de données (motifs, séquences, arbres, graphes, etc.), - traitement automatique des langues, - éventuellement en machine learning. De plus, le candidat devra avoir d'excellentes notions de programmation, notamment en Java et C/C++, et avoir une bonne maitrise du Français et de l'Anglais. *Diplôme requis*: Thèse, PhD *Lieu de travail*: IRISA, VANNES *Type de contrat*: CDD *Durée du contrat (en mois):* 24 *Quotité*: 100% *Salaire Brut / Mens ¤:* 2500 *Date prévisionnelle d'embauche*: novembre-décembre 2016 *Candidater: * Les CV, lettre de motivations et lettres de recommandations sont à envoyer à Giuseppe Berio et Nicolas Béchet : Giuseppe.berio@univ-ubs.fr et nicolas.bechet@irisa.fr