Proposition de poste : Ingénieur Recherche et Développement en traitement automatique de l'information chimique Société TecKnowMetrix (38) TecKnowMetrix est une jeune société innovante issue de l'université Pierre Mendès France et de l'INRA basée sur Voiron, à proximité de Grenoble. Elle conçoit et développe des méthodes et des outils d'analyse de l'information scientifique et technologique. De telles informations sont par exemple contenues dans des bases de données de brevets et publications, ainsi que sur différents documents issus de la Toile. L'objectif de TecKnowMetrix est de délivrer une vision synthétique, une cartographie, d'un environnement technologique complexe. Cette cartographie est destinée à des dirigeants d'entreprises, des responsables de R&D, des chercheurs, des investisseurs ou encore des élus de collectivités locales et elle est utile au pilotage de projets de recherche des laboratoires publics ou des groupes industriels innovants. L'obejctif de ce poste est de répondre à un besoin que nous avons en matière traitement de documents prenant place dans le domaine de la chimie et de la biologie. De tels documents contiennent des informations de différents types (schémas, dessins, formules chimiques, noms) désignant de mêmes molécules, faisant référence à de mêmes familles de molécules, etc. Cette grande diversité de l’information complique fortement son traitement et les analyses que nous souhaitons en faire. L'ingénieur intégrera l'équipe TKM et travaillera plus particulièrement avec les deux membres de l'équipe chargée de la R&D. Sous la responsabilité du directeur R&D, il devra prendre en charge les activités de recherche et développement en rapport à la gestion, à l'accès et à l’extraction de l’information chimique et biologique présentes dans la base de connaissances TecKnowMetrix. Cette base regroupe et organise des dizaines de milliers d'entités, que cela soit des documents (brevets, publications scientiques, etc.), des organisations, des individus, des colloques, des projets de recherche, etc. Elle s'accroît chaque jour. L'objectif de ce poste consiste donc à travailler à l'évolution des solutions logicielles afin de garantir l'optimisation de l'usage de cette base de connaissances en matière du traitement de l’information chimique et biologique. Trois principaux axes de travail devront être abordés durant ce travail : - Identification des molécules et de leurs interactions dans les textes : Isoler dans des textes (essentiellement brevets et publications) des noms de molécules et mettre en évidence des interactions entre entités. - Regroupement de graphies différentes désignant des molécules identiques ou des molécules / plantes appartenant à de mêmes familles : Catégoriser des graphies différentes avec dans des ensembles désignant des molécules identiques ou appartenant à des mêmes familles de molécules. - Analyse de formules chimiques et de dessins afin d’identifier les molécules désignées : Extraire à partir de formules chimiques et de dessins de molécules, les noms associés afin de mettre en commun des informations présentes dans les parties textuelles, les formules et les images des documents étudiés. L’objectif de ce poste consiste à avoir regard transversal sur les technologies liées aux axes de recherche et développement précédents. Si de telles technologies existent et sont jugées pertinentes, elles devront être adaptées et mises en place dans la plate-forme TecKnowMetrix. Si ce n’est pas le cas, de nouvelles méthodes de traitement de l’information chimique devront être élaborées, expérimentés sur les données de notre base de connaissances et implémentées dans notre plate-forme. Le profil recherché serait idéalement un jeune docteur ayant de fortes compétences en traitement automatique des langues et en chimie. Envoyer votre candidature (CV et lettre de motivation) par mail à : Thibault ROY - Directeur Recherche et Développement TecKnowMetrix - tr@tkm.fr