Descriptif ----------- - Sujet : Développement d'un outil générique d'annotation des ressources linguistiques - Niveau : M2 / dernière année d'école d'ingénieur - Domaine : informatique - Période : à partir de mars-avril 2015 - Durée : 6 mois Contexte -------- Acteur majeur des technologies de la langue, ELDA (Evaluations and Language resources Distribution Agency) est une PME dont les activités s'articulent principalement autour de la distribution et de la production de ressources linguistiques.Dans le cadre des projets de production de ressources linguistiques dont elle est en charge, ELDA est souvent amenée à des tâches de collecte, d'annotation de contrôle qualité, de packaging, etc.).Afin de pouvoir gérer la grande variété des différents protocoles et formats d'annotations, ELDA projette d'intégrer en une seule plate-forme un ensemble d'outils qui permettent la gestion homogène et transparente des ressources linguistiques annotées. Dans ce contexte, ELDA souhaite consolider sa plate-forme, qui devrait permettre : - d'importer des ressources annotées déjà existantes ; - de créer de nouvelles ressources linguistiques, y compris l'annotation de nouveaux corpus ; - de naviguer dans une ressource linguistique recensée dans la plate-forme, ou à travers plusieurs ressources ; - de récupérer et d'effectuer des statistiques sur des éléments des corpus et/ou des annotations. Travail à réaliser ------------------ Au sein de l'équipe de développement informatique d'ELDA, sous la tutelle d'un ingénieur spécialiste du traitement automatique des langues, vous serez amené à participer aux travaux suivants : - faire un état de l'art sur les outils d'annotation de ressources linguistiques disponibles actuellement ; - spécifier / réviser l'architecture de l'outil d'annotation à mettre en place chez ELDA ; - réaliser des développements dans des outils d'annotation, de concert avec les autres membres de l'équipe de développement informatique d'ELDA ; - développer des composantes logicielles d'importation et d'exportation de données annotées depuis et vers des formats existants, autres que le format utilisé par l'outil d'annotation. Vos participerez également aux réunions périodiques de l'équipe de développements logiciels d'ELDA. Profil souhaité --------------- - BAC + 4/5 / Dernière année d'École d'ingénieur ; - Bonnes connaissances pratiques de la programmation orientée objet ; - Connaissances de base en algorithmique ; - Connaissances de base des architectures des applications Web ; - Connaissance pratique d'un système de gestion de bases de données ; - Anglais technique ; - La connaissance du langage Python sera appréciée ; - Des notions sur le langage JavaScript seront un plus. Candidature ----------- Ce stage, d'une durée de 6 mois et basé à Paris dans le 13e arrondissement (Les Gobelins), est à pourvoir au printemps 2015. Les candidatures (CV, lettre de motivation) doivent être adressées à Vladimir Popescu (vladimir@elda.org). Le stage fait l'objet d'une rémunération, variable en fonction du niveau d'études du candidat. www.elda.org