*Objectif* Afin d'améliorer le processus de dépôt des fichiers de type image, la société ClinSearch souhaite optimiser sa solution applicative d'identification et de masquage des données identifiantes présentes dans des fichiers de type image. Après avoir réalisé une revue de la littérature sur le sujet, le stage vise à prendre en main un certain type de fichiers (archive composée de plusieurs fichiers), à identifier les zones comprenant des données identifiantes (par exemple, application d'un système open source de reconnaissance optique de caractères - OCR), à masquer la zone contenant des données nominatives sur toutes les images, puis à générer une nouvelle archive avec ces données masquées, tout en s'assurant, dans certains cas, qu'elles restent conformes au format d'origine, que la résolution d'origine soit préservée, et qu'elles demeurent exploitables par certains logiciels de visualisation. *Profil* - master ou école d'ingénieur en informatique - expérience de traitement des images, préférentiellement de l'imagerie médicale - expérience en traitement automatique des langues - goût pour la recherche - capacité de travail à distance En fonction des résultats du stage, une poursuite en thèse de doctorat en contrat Cifre avec la société ClinSearch est envisageable. *Durée :* 5/6 mois *Lieu du stage et co-encadrement :* - ClinSearch (Malakoff) : Thibault Bogniaho (thibault.bogniaho@clinsearch.net) - Laboratoire Interdisciplinaire des Sciences du Numérique - LISN (Orsay) : Cyril Grouin (cyril.grouin@lisn.upsaclay.fr) et Emmanuelle Frenoux (emmanuelle.frenoux@limsi.fr) Pour candidater, envoyer un CV et un relevé de notes aux trois personnes précédemment mentionnées. *Gratifications :* 588,9 /mois