Contexte : Créée en 2009, GEOLSemantics est un éditeur de logiciels innovants dans le domaine des technologies de l'information et de la communication, et plus particulièrement dans le domaine de l'extraction d'informations. Les solutions de GEOLSemantics analysent les contenus textuels pour identifier, normaliser et structurer les données pertinentes qu'ils contiennent, afin de les rendre directement exploitables par des processus automatiques. Mission : Dans le cadre de la mise en place d'une nouvelle fonctionnalité dans sa solution globale, GEOLSemantics propose un stage en informatique pour l'industrialisation de son outil de détection d'une grande liste de mots dans un flux très volumineux de textes. L'algorithme à implémenter est un automate d'etat fini réalisé sous forme d'un dictionnaire arborescent au niveau du caractère garantissant des temps de traitement compatibles avec les volumes à traiter. La mission principale sera de réaliser la préparation des données, l'algorithme de détection des mots ba sé sur le parcours du dictionnaire arborescent. Il sera aussi demandé de réaliser une interface afin de permettre la consultation des résultats obtenus afin de présenter les capacité de ce traitement.. Le stage se découpera de la manière suivante : * Compréhension et implémentation de l'algorithme de détection des mots * Émission d'alertes * Réalisation d'une interface de consultation des résultats Il sera aussi demandé, à chaque phase, de réaliser les tests et la documentation nécessaires. Profile recherché : - Formation d'ingénieur ou maitrise informatique - Environnement technique : Windows/Linux, Java/Python, Eclipse/Netbeans, SVN, Maven, ... - Autonomie - Bonne aisance rédactionnelle - Capacité à travailler en équipe Durée : minimum 6 mois Date de début : avril 2019 Lieu : Gentilly Pour postuler, envoyez votre candidature à christian.fluhr@geolsemantics.com www.geolsemantics.com