Bonjour, Un sujet de stage est proposé dans le cadre plus large d'un projet de recherche réunissant plusieurs laboratoires : LORIA (Nancy), GREYC (Caen) - LIPN (Paris 13), INSERM (Paris) et MoDyCo (Paris 10). Ce projet a pour objectif d'extraire des informations à partir de textes biologiques et médicaux sur les maladies orphelines (dites aussi maladies rares) pour apporter une aide automatique à l'enrichissement d'une base de connaissances, notamment du site d'information Orphanet dédié à ce type de maladies. Pour une présentation générale du projet et de quelques résultats en particulier, on pourra consulter le site dédié : http://hybride.loria.fr/ Le stage portera plus précisément sur le repérage des symptômes liés à ces maladies dans des textes scientifiques en anglais. Plusieurs techniques ont été déjà développées dans le cadre du projet, notamment la fouille de données, l'analyse syntaxique et les CRF (Conditionnal Random Fields). Les programmes informatiques développés et des jeux de corpus seront fournis. Il s'agira de les expérimenter afin de comparer leurs avantages et leurs défauts, puis on cherchera à améliorer les résultats en proposant une combinaison de ces techniques. Quelques références bibliographiques : Laure Martin, Delphine Battistelli, Thierry Charnois (2014). Symptom recognition issue, in Proceedings BioNLP 2014 (13th Workshop on Biomedical Natural Language Processing), held in conjunction with ACL'2014 (52nd Annual Meeting of the Association for Computational Linguistics), 26-27 juin 2014, p.107-111, Baltimore, USA. Laure Martin, Delphine Battistelli, Thierry Charnois (2014). Mise en place d'une méthode de reconnaissance des symptômes dans le contexte des maladies rares, in Actes Atelier Ingénierie des Connaissances et Santé, IC 2014 (25es Journées francophones d'Ingénierie des Connaissances), 13 mai 2014, 8 pages, Clermont-Ferrand. Jean-Philippe Métivier, Laurie Serrano, Thierry Charnois, Bertrand Cuissart and Antoine Widlöcher (2015). Automatic symptom extraction from texts to enhance knowledge discovery on rare diseases, in proceedings of the Conference on Artificial Intelligence in Medicine (AIME 2015), Lecture Notes in Computer Science 9105, Springer 2015, pp. 249-254, Pavia, Italy, June 17-20, 2015. Encadrement : Delphine Battistelli (Laboratoire MoDyCo, Université Paris 10) et Thierry Charnois (Laboratoire LIPN, Université Paris 13) Rémunération : selon la réglementation en vigueur, soit environ 540 euros mensuel, plus prise en charge partielle des frais de transport (50% de l'abonnement navigo entre la résidence et le lieu du stage). Durant le stage, des réunions de travail pourront avoir lieu sur le site des partenaires du projet. Ces déplacements seront entièrement pris en charge financièrement. Durée : 4-5 mois Profil recherché : - Niveau : Master 2 ou ingénieur dernière année - Domaine de spécialité requis: TAL ou Informatique avec connaissances en apprentissage ou TAL Candidature : envoi d'un CV à delphine.battistelli@u-paris10.fr et Thierry.charnois@lipn.univ-paris13.fr accompagné d'une lettre de motivation ainsi que des notes de l'année universitaire en cours et de l'année dernière.