Stage rémunéré de traitement automatique de langage naturel (TAL) 1. Cadre général IMS Health est un partenaire privilégié des plus grands laboratoires pharmaceutiques mondiaux et une entreprise de référence en matière de traitement de données de santé/médicament. Les bases de données des dossiers patients constituent une des forces incontournables d'IMS. En France, la base Disease Analyzer (TM) contient plus de 5 millions de patients dont certains suivis depuis l'an 2000. Cette base comporte des informations provenant du dossier patient des médecins membre d'un panel représentatif et comprend les diagnostics, les traitements et les caractéristiques des patients. Une partie des informations est saisie sous forme de texte libre. Cette partie pourrait contenir des informations d'une grande valeur sur les résultats d'examens biologiques, orientations diagnostiques, consignes de traitement ou encore des données sur l'observance thérapeutique. IMS souhaite mettre en place un outil de traitement de langage naturel (TAL) permettant le codage et la structuration de ses données en commençant par les résultats d'examens de laboratoire. 2. Contenu du stage Les données sont hébergées chez IMS et dans une base SQL Server. L'objectif est d'examiner un corps de textes courts (quelques mots à quelques phrases) saisi par les médecins dans les dossiers patients afin détecter, codifier et structurer les informations pertinentes: Dans un premier temps on cherche à examiner chaque corps de texte dans le contexte du dossier patient pour comprendre son orientation globale et pour le classifier selon son thème : examen clinique, imagerie, données d'observance, décision thérapeutique, justification diagnostique, etc. Dans un deuxième un travail exploratoire sera réalisé autour d'architectures pour le Traitement Automatique de la Langue (UIMA, GATE, OpenNLP) et en fonction de leur intérêt pour structurer ces données. Dans un troisième temps, le stagiaire développera un programme informatique (en Java) permettant de structurer et codifier au mieux l'information pour une des catégories (examens laboratoire). 3. Profil - Etudiant en informatique avec notamment des connaissances en bases de données - Forte motivation, rigueur et esprit d'équipe - Connaissance du langage médical ou une expérience précédente de TAL sera un plus. 4. Localisation et encadrement Le stagiaire sera encadré par IMS et sera en contact avec un laboratoire d'informatique médicale (LIM&BIO). D'une durée de 6 mois, il se déroulera dans les locaux d'IMS (Puteaux, 92). En fonction des besoins, des déplacements au laboratoire seront possibles. 5-Rémunération Selon le profil, pouvant aller jusqu'à 1000 euros par mois. 6-Contact Dr Massoud TOUSSI, MD, PhD Medical Director, Health Economics & Outcomes Research IMS Consulting Group 91, rue Jean Jaurès 92800 PUTEAUX France Tel: +33 (0)1-41 35 13 35 Fax: +33 (0)1-41 35 13 49 email: mtoussi@imscg.com http://www.imsconsultinggroup.com