Post-doc 2 ans, projet Quaero à MIG (INRA) ----------------------------------- Mots-clefs : extraction d’information, apprentissage automatique, TALN, biologie moléculaire. Contexte : ------------- L'équipe Bibliome de l'unité INRA Mathématiques, Informatique et Génome (MIG) développe des méthodes de recherche et d’extraction d’information dans la littérature scientifique et technique, basées sur l’acquisition automatique de connaissances à partir de corpus. L’éventail de ces connaissances couvre un large spectre, des critères de segmentation jusqu’aux ontologies. Le domaine de la biologie est un domaine d’application privilégié, mais non exclusif. L’activité de recherche de l’unité MIG est pluridisciplinaire (math-info, biologie), fondamentale et appliquée. Le post-doc est proposé dans le cadre des activités de recherche et développement en analyse de contenu textuel pour le projet de recherche Quaero. Mission : ------------ Le post-doctorant sera en charge du développement, de l’adaptation et de l’évaluation de méthodes d’acquisition de règles d’extraction de connaissances sémantiques à partir de corpus en langage naturel et contribuera à leur intégration dans la plateforme de traitement Alvis.. Les interactions géniques entre gènes et protéines est un exemple du type de relation sémantique recherchée. L’approche privilégiée par l’équipe est basée sur la normalisation automatique des corpus d’apprentissage grâce à une analyse linguistique profonde (par ex. terminologie, catégories sémantiques). Les outils, bases de connaissance et corpus nécessaires sont disponibles à MIG. Ces activités seront conduites en collaboration étroite avec les membres de l’équipe en fonction des domaines (développement informatique, apprentissage automatique, TAL, biologie). Profil : --------- Thèse en informatique ou diplôme d'ingénieur d'université ou de grande école. Spécialisation en TAL ou apprentissage automatique. Expérience significative en « text mining », apprentissage automatique ou linguistique computationnelle. Bonnes compétences en ingénierie informatique. Capacité à développer et intégrer des outils d’IA. Maîtrise et expérience d’au moins deux langages de programmation parmi C, C++, Perl et Java. Des connaissance des technologies Web (RDF, OWL, XSLT) et bases de données (PostgreSQL) sont un plus. Intérêt pour la biologie. Poste : -------- Contrat à durée déterminée au niveau Ingénieur de Recherche de 2 ans à partir du 1er février 2009. La rémunération est fonction de l'expérience professionnelle du candidat et ne sera pas inférieure à l’équivalent titulaire (2 570 euros salaire brut mensuel). Le poste est localisé au centre de recherche de l'INRA à Jouy-en-Josas dans les locaux de l'unité MIG. A noter, un poste d’Ingénieur de Recherche titulaire dans le même cadre de travail, sera ouvert au concours au printemps 2009 par l'INRA. Dossier : ---------- - Un CV détaillé incluant la description de la participation éventuelle du candidat à des projets de recherche institutionnels et à des développements informatiques. - Eventuellement, rapports de thèse - Travaux personnels (Article, Mémoire) Contacts : ----------- Claire Nédellec (resp. d'équipe) : Claire.Nedellec@jouy.inra.fr Robert Bossy (chef de projet) : Robert.Bossy@jouy.inra.fr URL de l'équipe : http://genome.jouy.inra.fr/bibliome URL de l’unité : http://mig.jouy.inra.fr URL du projet Quaero : http://www.quaero.org URL de la page recrutement de l’INRA : http://www.inra.fr/les_hommes_et_les_femmes/rejoignez_nous/devenir_ingenieur_ou_technicien_a_l_inra/concours_externes