CDD 1 ans, ingénieur d'étude, projet de recherche FSOV SAM à MIG (INRA). Centre de recherche de Jouy-en-Josas (région parisienne) ----------------------------------- Mots-clefs : extraction d'information, apprentissage automatique, TALN, biologie moléculaire. Contexte : ------------- L'emploi concerne l'extraction d'information, d'entités nommées et de relations à partir d'articles scientifiques, pour le projet de recherche FSOV (Fond de soutien à l'obtention végétale) intitulé SAM (Sélection assistée du blé tendre par marqueur génétique). L'équipe Bibliome de l'unité INRA Mathématiques, Informatique et Génome (MIG) développe des méthodes de recherche et d'extraction d'information dans la littérature scientifique et technique, basées sur l'acquisition automatique de connaissances à partir de corpus (entités nommées, terminologies, ontologies). L'activité de recherche de l'unité MIG est pluridisciplinaire (math-info, biologie), fondamentale et appliquée. Mission : ------------ Il s'agira de développer et d'adapter les méthodes d'acquisition de règles d'extraction de connaissances sémantiques à partir de corpus d'articles en langage naturel et de contribuer à leur intégration dans la plateforme de traitement Alvis. Les entités nommées à reconnaître sont principalement des caractères (résistance aux maladies), et des noms de variété de blé, de gènes et de marqueurs. L'approche privilégiée par l'équipe est basée sur la normalisation automatique des corpus d'apprentissage grâce à une analyse linguistique profonde (par ex. terminologie, catégories sémantiques). Ces activités seront conduites en collaboration étroite avec les biologistes du projet (unité UMR INRA Génétique, Diversité et Ecophysiologie des Céréales), Arvalis et UFS, qui spécifient les connaissances à extraire, annoteront les exemples d'apprentissage et valideront et exploiteront les résultats de l'extraction. Profil : --------- Master ou diplôme d'ingénieur en informatique ou bioinformatique. Spécialisation en TAL ou apprentissage automatique. Bonnes compétences en ingénierie informatique. Capacité à développer et intégrer des outils d'IA. Maîtrise et expérience d'au moins deux langages de programmation parmi C, C++, Perl et Java. Des connaissance des technologies Web (RDF, OWL, XSLT) et bases de données (PostgreSQL) sont un plus. Intérêt pour la biologie. Poste : -------- Contrat à durée déterminée au niveau Ingénieur d'étude de 1 ans à partir du 1er décembre 2010, éventuellement prolongeable. La rémunération est de 1 917 euros brut par mois. Le poste est localisé au centre de recherche de l'INRA à Jouy-en-Josas dans les locaux de l'unité MIG. Un logement sur place pourra être attribué pour quelques mois. Dossier : ---------- - Un CV détaillé incluant la description de la participation éventuelle du candidat à des projets de recherche institutionnels et à des développements informatiques. - Travaux personnels (Article, Mémoire) - Notes de Master ou école Contacts : ----------- Claire Nédellec (resp. d'équipe) : Claire.Nedellec@jouy.inra.fr Robert Bossy (chef de projet) : Robert.Bossy@jouy.inra.fr URL de l'équipe : http://genome.jouy.inra.fr/bibliome URL de l'unité : http://mig.jouy.inra.fr