Ingénieur de recherche ou post doc data scientist spécialisé en traitement automatique du langage sur données massives en santé L'équipe projet Données Massives en Santé (15 personnes) du Laboratoire Traitement du Signal et de l'Image (LTSI - UMR Inserm 1099) est composée d'ingénieurs de recherche et développement logiciel, de data scientists et de professionnels de santé spécialisés en informatique médicale qui conçoivent et développent des méthodes et outils d'intégration et de fouille de données massives en santé (Big Data). Elle intervient sur divers projets de recherche et développement, autour de ces thématiques, aussi bien dans un cadre interrégional (BIGCLIN, Réseau des Centres de Données Cliniques), national (projets INSHARE, PEPS) et international (IT-Foc, FIGTEM) en synergie avec le centre hospitalier universitaire de Rennes. L'équipe a une politique de transfert technologique. Elle développe un partenariat industriel pour le déploiement de son système eHop (entrepôt et outil de fouille de données biomédicales) dans les CHU. (voir : https://goo.gl/OhlG98 ) Poste et mission Développer au sein de l'équipe un axe traitement des données textuelles médicales (recherche d'information et plus généralement text mining) qui puisse répondre aux cas d'usages définis avec l'équipe médicale. Développer, implémenter et évaluer des méthodes de traitement automatique du langage innovantes sur très larges volumes de données cliniques Participer aux cycles R&D du logiciel en lien avec l'équipe d'ingénieur : prospective/prototypage, évaluation, conception et développements, transfert industriel Valoriser les travaux au travers de publications scientifiques dans des journaux et des conférences de références. Participer aux réponses d'appel d'offre recherche. Profil : Diplômé(e) de l'enseignement supérieur (bac +5 et/ou doctorat) Background en mathématique, statistique et machine Learning, expérience d'utilisation de larges volumes de données, expérience en traitement automatique du langage, capacité à conduire des études expérimentales, compétence en analyse de données, écriture scientifique, ainsi qu'en présentation et communication ; Forte expérience en programmation et développement des systèmes. Expériences en modélisation, en terminologies et ontologies médicales, python, R, Apache SPARK sont un gros plus. Capacité à travailler en équipe pluridisciplinaire. Environnement scientifique et technique Lieu : Centre des Données Clinique du CHU de Rennes / Faculté de médecine - Université Rennes1 Applications : recherche clinique, épidémiologie, pharmacovigilance, études médico- économiques, médecine 4Pltsi Entrepôts de données biomédicales du biomédical du grand ouest : exemple à Rennes : 1,6 millions de patients, 33 millions de documents cliniques, 330 millions d'éléments de données Thèmes de recherche : big data en santé, intégration et fouille de données, interopérabilité et sémantique, intégration des méthodes TAL, machine learning, analyse de cluster Technologies : calcul distribué, php, java, R, oracle, BD nosql, Framework Big data (spark), responsive framework Contrat de 12 mois (renouvelable) à Rennes Poste immédiatement disponible (Fév 2017) Envoyer CV et lettre de motivation à marc.cuggia@univ-rennes1.fr