Sujet: Développement d'un moteur de recherche robuste pour naviguer dans des collections de documents Niveau : L3 ou M1 / première ou deuxième année d'école d'ingénieur Domaine : informatique Période : à partir de mi-janvier 2016 Durée : 4-6 mois *Travail à réaliser* Au sein de l'équipe de développement informatique d'ELDA, sous la tutelle d'un ingénieur spécialiste des technologies de la langue et du développement d'applications Web, vous serez amené à participer aux travaux suivants : * faire un état de l'art exhaustif sur les possibilités actuelles offertes par les moteurs de recherche les plus puissants, tels que Solr, Elastic, ou bien les facilités de recherche textuelle offertes par des SGBD (Système de Gestion des Bases de Données) tels que PostgreSQL. * participer à la spécification des besoins de recherche textuelle dans les actes de la conférence LREC ; * participer au choix de la solution technique la plus appropriée pour les actes de LREC ; * participer à la conception de la structure d'une base de données (schéma de données) pour modéliser le contenu des sites Web recensant les articles de la conférence LREC ; * extraire les informations pertinentes des sites recensant les articles de la conférence LREC et réaliser la mise en données de ces informations, utilisant le schéma de données mentionné ci-dessus; * implémenter un moteur de recherche exhaustive à travers tous les actes de la conférence LREC, compte tenu des contraintes dégagées lors des étapes antérieures ; Vos participerez également aux réunions périodiques de l'équipe de développements logiciels d'ELDA. *Profil souhaité* * Bac + 3 ou 4 / Première ou deuxième année d'École d'ingénieur ; * Connaissances de base en algorithmique ; * Connaissances de base des architectures des applications Web ; * Connaissance pratique d'un système de gestion de bases de données (PostgreSQL de préférence) ; * Anglais technique ; * La connaissance d'un moteur de recherche (Solr, Elastic, Lucene) sera appréciée ; * La connaissance des langages JavaScript et / ou Python sera un plus. *Candidature* Ce stage, d'une durée de 3 mois et basé à Paris dans le 13e arrondissement (Les Gobelins), est à pourvoir en janvier 2016. *Les candidatures (CV, lettre de motivation) doivent être adressées à Vladimir Popescu (vladimir@elda.org).* Le stage fait l'objet d'une rémunération, variable en fonction du niveau d'études du candidat. -*-*-*-*-*-*-*- Acteur majeur des technologies de la langue, ELDA (Agence pour la distribution des ressources Linguistiques et l'Evaluation) est une PME dont les activités s'articulent principalement autour de la distribution et de la production de ressources linguistiques. À ce titre, ELDA assure le fonctionnement opérationnel d'ELRA (European Language Resource Association), association européenne à but non-lucratif assurant la promotion des ressources linguistiques dans un contexte européen. Depuis 1998, ELRA organise une conférence internationale bisannuelle, LREC (Language Resources and Evaluation Conference), qui réunit, à chaque édition, des centaines de chercheurs de premier rang du monde entier, qui y présentent des articles de recherche scientifique. Afin de faciliter la navigation dans ce thésaurus d'articles scientifiques, ELDA a mis au point un ensemble de sites Web recensant ces articles, ainsi que des informations les concernant (auteurs, titres, résumés des articles, etc.). Dans ce contexte, ELDA souhaite consolider ces sites, et notamment permettre aux utilisateurs d'effectuer des recherches robustes et exhaustives à travers ses collections d'articles correspondant à toutes les éditions de la conférence LREC. www.elda.org