Stage de Master / Ecole d'ingénieur : paramétrage et évaluation d'un système de classification automatique de rapports de sécurité. L'entreprise : CFH (Conseil en facteurs humains)/SafetyDATA est une PME spécialisée dans le traitement automatique des langues dans le domaine de la sécurité. Elle travaille en collaboration avec CLLE-ERSS, un laboratoire de linguistique, et plus particulièrement avec l'équipe TAL (Traitement automatique des langues). Le stage sera co-encadré par CFH et le laboratoire CLLE. Contexte : CFH a conçu un système de traitement automatique des langues (TAL) dont le but est d'analyser des rapports d'incidents afin de proposer une ou plusieurs catégorie(s) pour leur indexation dans une base de données. Le système est actuellement déployé et analyse chaque mois plusieurs centaines de documents (en français et en anglais) à l'aide de règles apprises automatiquement et basées sur le repérage de certains termes dans les rapports analysés. Voir plus de détails sur http://www.safety-data-analysis.com/ Le stage vise l'évolution de ce système de classification, notamment en envisageant l'utilisation d'un système d'apprentissage supervisé statistique. L'objectif de ce stage est double : 1/ Identifier et quantifier le gain apporté par l'utilisation d'un modèle statistique (SVM, régression logistique, réseau bayésien, etc.) par rapport au système actuel ; 2/ Mesurer l'impact sur les performances du système des différents traitements linguistiques appliqués aux documents avant leur analyse (correction des erreurs, normalisation des formes de surface, identification d'expressions complexes, utilisation de classes sémantiques, etc.). Profil recherché : Etudiant en deuxième année de master ou dernière année d'école d'ingénieur, en informatique ou traitement automatique des langues. Compétences requises : Systèmes de classification automatique par apprentissage artificiel. L'étudiant doit connaître le fonctionnement de ces systèmes et être autonome quant à leur utilisation et évaluation (scripts, gestion de données volumineuses, etc.) On attend également de l'étudiant une capacité à observer les données et à s'intégrer dans un environnement interdisciplinaire. Détails : - stage conventionné basé à Toulouse - durée : 4 à 6 mois à partir de mars Contact : Céline Raynal raynal@conseil-fh.fr Ludovic Tanguy tanguy@univ-tlse2.fr