Post-doc 2 ans, projet Quaero à MIG (INRA)
-----------------------------------

Mots-clefs : extraction d’information, apprentissage automatique, TALN, 
biologie moléculaire.

Contexte :
-------------
L'équipe Bibliome de l'unité INRA Mathématiques, Informatique et
Génome (MIG) développe des méthodes de recherche et d’extraction
d’information dans la littérature scientifique et technique, basées
sur l’acquisition automatique de connaissances à partir de corpus.
L’éventail de ces connaissances couvre un large spectre, des critères
de segmentation jusqu’aux ontologies. Le domaine de la biologie est un
domaine d’application privilégié, mais non exclusif. L’activité de
recherche de l’unité MIG est pluridisciplinaire (math-info, biologie),
fondamentale et appliquée.
Le post-doc est proposé dans le cadre des activités de recherche et
développement en analyse de contenu textuel pour le projet de
recherche Quaero.

Mission :
------------
Le post-doctorant sera en charge du développement, de l’adaptation et
de l’évaluation de méthodes d’acquisition de règles d’extraction de
connaissances sémantiques à partir de corpus en langage naturel et
contribuera à leur intégration dans la plateforme de traitement
Alvis..  Les interactions géniques entre gènes et protéines est un
exemple du type de relation sémantique recherchée. L’approche
privilégiée par l’équipe est basée sur la normalisation automatique
des corpus d’apprentissage grâce à une analyse linguistique profonde
(par ex.  terminologie, catégories sémantiques). Les outils, bases de
connaissance et corpus nécessaires sont disponibles à MIG.  Ces
activités seront conduites en collaboration étroite avec les membres
de l’équipe en fonction des domaines (développement informatique,
apprentissage automatique, TAL, biologie).

Profil :
---------

Thèse en informatique ou diplôme d'ingénieur d'université ou de grande
école.
Spécialisation en TAL ou apprentissage automatique.
Expérience significative en « text mining », apprentissage automatique
ou linguistique computationnelle.
Bonnes compétences en ingénierie informatique. Capacité à développer
et intégrer des outils d’IA.
Maîtrise et expérience d’au moins deux langages de programmation parmi
C, C++, Perl et Java.
Des connaissance des technologies Web (RDF, OWL, XSLT) et bases de
données (PostgreSQL) sont un plus.
Intérêt pour la biologie.

Poste :
--------
Contrat à durée déterminée au niveau Ingénieur de Recherche de 2 ans à
partir du 1er février 2009. La rémunération est fonction de
l'expérience professionnelle du candidat et ne sera pas inférieure à
l’équivalent titulaire (2 570 euros salaire brut mensuel). Le poste
est localisé au centre de recherche de l'INRA à Jouy-en-Josas dans les
locaux de l'unité MIG.

A noter, un poste d’Ingénieur de Recherche titulaire dans le même
cadre de travail, sera ouvert au concours au printemps 2009 par
l'INRA.

Dossier  :
----------
- Un CV détaillé incluant la description de la participation
  éventuelle du candidat à des projets de recherche institutionnels et
  à des développements informatiques.
- Eventuellement, rapports de thèse
- Travaux personnels (Article, Mémoire)

Contacts :
-----------
Claire Nédellec (resp. d'équipe) : Claire.Nedellec@jouy.inra.fr
Robert Bossy (chef de projet) : Robert.Bossy@jouy.inra.fr

URL de l'équipe : http://genome.jouy.inra.fr/bibliome
URL de l’unité : http://mig.jouy.inra.fr
URL du projet Quaero : http://www.quaero.org
URL de la page recrutement de l’INRA : 
http://www.inra.fr/les_hommes_et_les_femmes/rejoignez_nous/devenir_ingenieur_ou_technicien_a_l_inra/concours_externes