CDD 7 mois, ingénieur d'étude en ingénierie des connaissances à MIG (INRA) ----------------------------------- Mots-clefs : recherche sémantique d'information, acquisition et modélisation de connaissance à partir de corpus, termino-ontologie, annotation sémantique, agronomie, implantation des cultures. Contexte : ------------- L'équipe Bibliome de l'unité INRA Mathématiques, Informatique et Génome (MIG) développe des méthodes de recherche et d'extraction d'information dans la littérature scientifique et technique, basées sur l'acquisition de connaissances à partir de corpus (entités nommées, terminologies, ontologies) et l'annotation sémantique à l'aide de méthodes de TALN et d'apprentissage automatique. L'équipe Bibliome en partenariat avec le GIS GC HP2E (systèmes de production de grande cultures à hautes performances économiques et environnementales) et le service documentaire de l'INRA (DV/IST) développe une instance "GISculture" du moteur de recherche sémantique AlvisIR dans le domaine de l'implantation des cultures. L'équipe Bibliome est en charge de la construction de la termino-ontologie du domaine et l'indexation sémantique de la collection documentaire. La DV/IST identifie et rassemble les documents pertinents et les thésaurus du domaine de l'implantation des cultures. Mission : ------------ La mission a deux volets, (1) la conception de la termino-ontologie et (2) l'annotation sémantique automatique de la collection à l'aide de cette ressource. La conception de la termino-ontologie exploitera les terminologies existantes et la complètera avec les outils d'extraction et de structuration de terminologie à partir de corpus, YateA et TyDI. L'annotation sémantique utilisera la plateforme Alvis. Une première étape normalisera les documents au format texte à l'aide d'outils de transformation de format en fonction de leur origine. Les objectifs scientifiques de la mission portent sur l'évaluation et l'évolution des outils d'acquisition des connaissances utilisés. Ces activités seront conduites en collaboration étroite avec les agronomes du GIS (Arvalis, ITB) et les documentalistes de la DV/IST, qui contribueront à spécifier les axes de modélisation de l'ontologie, valideront les propositions d'extension de la termino-ontologie et évalueront le moteur de recherche sémantique. Les résultats du projet seront présentés au Directoire Opérationnel du GIS à la fin de la mission et déployés. Profil : --------- Master ou diplôme d'ingénieur en informatique ou agronomie. Spécialisation en ingénierie documentaire, TAL ou acquisition des connaissances. Bonnes compétences en ingénierie informatique. Capacité à configurer et utiliser des outils d'IA (TAL, éditeur d'ontologie, moteur de recherche sémantique) et d'ingénierie documentaire. Intérêt pour l'agronomie. Poste : -------- Contrat à durée déterminée au niveau Ingénieur d'étude de 7 mois à partir du 1er février 2012. La rémunération pour un débutant est de 1995 euros brut par mois. Le poste est localisé au centre de recherche de l'INRA à Jouy-en-Josas dans les locaux de l'unité MIG. Un logement sur place pourra être attribué pour quelques mois. Dossier : ---------- Le dossier comportera nécessairement, - Un CV détaillé incluant la description de la participation du candidat à des projets de recherche et à des développements informatiques. - L'ensemble des notes de Master ou de l'école. - et éventuellement les travaux personnels (article, mémoire de Master) Le dossier sera à envoyer par mail aux deux contacts ci-dessous. Contacts : ----------- Claire Nédellec (resp. d'équipe) : Claire.Nedellec@jouy.inra.fr Robert Bossy (chef de projet) : Robert.Bossy@jouy.inra.fr URL de l'équipe : http://bibliome.jouy.inra.fr/ URL de l'unité : http://mig.jouy.inra.fr URL de GisDemo : http://bibliome.jouy.inra.fr/alvisir/gisdemo/Results?query=pesticide Références ------ Claire Nédellec, Wiktoria Golik, Sophie Aubin, Robert Bossy, "Building Large Lexicalized Ontologies from Text: a Use Case in Indexing Biotechnology Patents", International Conference on Knowledge Engineering and Knowledge Management (EKAW 2010), Lisbon, Portugal, 11th 15th octobre, 2010. Claire Nédellec, Adeline Nazarenko, Robert Bossy "Information Extraction", Handbook on Ontology., S. Staab, R. Studer (eds.), Springer Verlag, 2009.