Sujet de stage en informatique Prétraitement de données textuelles pour un système d'analyse sémantique Entreprise : Rebuz SAS, Strasbourg Durée : 2-5 mois Niveau : M1-M2 Rémunération : 436,05 euros/mois Contact : Mme Yuliya Goncharova, 4arly@bk.ru Détails : Rebuz est une société spécialisée dans l'analyse de textes pour la veille économique. Le système original repose sur l'analyse sémantique épaulée par des principes de la linguistique cognitive. Le stage portera sur l'amélioration du module de prétraitement existant. Ce sujet sera particulièrement intéressant pour les étudiants souhaitant en apprendre plus sur le Traitement Automatique de Langues (TAL) et sur la Recherche d'Information (RI). Les tâches seront adaptées selon le niveau et les préférences du (de la) candidat(e) sélectionné(e). Objectifs du stage * Révision du module actuel (écrit en Java) * Nettoyage et optimisation du code * Intégration de l'étiqueteur morphosyntaxique MACAON [1] * Séries de tests et perfectionnement Compétences recherchées : - aisance dans la programmation en Java (un échantillon de code sera demandé) - bonnes connaissances des tests unitaires (JUnit) - bonnes capacités de travail en équipe - rigueur - responsabilité - autonomie [1] http://macaon.lif.univ-mrs.fr/