*Contexte* :

Le post-doc s'inscrit dans le projet industriel VOCAGEN. Ce projet de 26
mois a pour objectif de permettre la saisie intuitive d'informations en
contexte de mobilité (sur des terminaux type tablette ou smartphone).

L'objectif du post-doc est la proposition et la mise en place
d'algorithmes permettant l'acquisition de connaissances à partir de
données textuelles de domaines métiers. Ces connaissances seront
modélisées sous la forme d'ontologies afin permettre leur intégration
dans les outils des partenaires industriels du projet VOCAGEN.

Ces outils permettent entre autre la mise en oeuvre d'un dialogue
homme-machine en langue française qui à terme devra permettre la saisie
automatique d'informations sur des terminaux mobiles.

*Sujet* :

Les travaux à mener s'inscrivent principalement dans le contexte de
l'Ontology Learning. Les différentes tâches envisagées peuvent être
décomposées comme suit.

La première tâche du post-doctorant consiste en la réutilisation et le
test de techniques et outils fournis par les partenaires du projet
VOCAGEN afin d'en maitriser le fonctionnement et les besoins
d'intégration.

La deuxième tâche consiste à proposer (ou adapter) un outil permettant
l'extraction de concepts à partir de données textuelles tels que des
corpus d'énoncés recueillis en situation par les partenaires ou encore
des données recueillies sur le Web. Des expériences intermédiaires
pourront être menées en utilisant l'anglais mais, l'outil devra
fonctionner pour des données textuelles en français. Une amélioration
significative par rapport à l'état de l'art est attendue pour
l'extraction de concepts.

La troisième tâche concerne l'extraction de patrons lexico-syntaxiques
qui s'appuie sur la proposition ou la modification d'algorithmes
d'extraction de motifs ou de patrons dans les données textuelles. Cette
tâche permettra à termes d'améliorer les techniques existantes pour
l'acquisition de relations (ad-hoc ou connues a priori, comme les
relations taxonomiques ou de composition) entre les concepts.
Finalement, la modélisation des connaissances extraites sera faite sous
forme d'ontologie.

Par ailleurs, tout au long du travail, il sera nécessaire de valider les
différents algorithmes proposés en se comparant d'une part à l'existant
ou encore en utilisant un corpus annoté. Ainsi, une tâche à mener en
parallèle consistera à produire un tel corpus, notamment avec l'appui
des partenaires industriels du projet, afin de permettre la mise en
oeuvre d'un protocole d'évaluation des outils et des algorithmes
proposés.

*Compétences* *souhaitées* :

Le profil recherché est un docteur en Informatique, possédant des
compétences en :

- Ontology Learning,

- fouille de données (motifs, séquences, arbres, graphes, etc.),

- traitement automatique des langues,

- éventuellement en machine learning.

De plus, le candidat devra avoir d'excellentes notions de programmation,
notamment en Java et C/C++, et avoir une bonne maitrise du Français et
de l'Anglais.

*Diplôme requis*: Thèse, PhD

*Lieu de travail*: IRISA, VANNES

*Type de contrat*: CDD

*Durée du contrat (en mois):* 24

*Quotité*: 100%

*Salaire Brut / Mens ¤:* 2500

*Date prévisionnelle d'embauche*: novembre-décembre 2016

*Candidater: *

Les CV, lettre de motivations et lettres de recommandations sont à
envoyer à Giuseppe Berio et Nicolas Béchet :

Giuseppe.berio@univ-ubs.fr et nicolas.bechet@irisa.fr