Contexte Créée en 2009, GEOLSemantics est un éditeur de logiciels innovants dans le domaine des technologies de l'information et de la communication, et plus particulièrement dans le domaine de l'extraction d'informations. Les solutions de GEOLSemantics analysent les contenus textuels pour identifier, normaliser et structurer les données pertinentes qu'ils contiennent, afin de les rendre directement exploitables par des processus automatiques. Mission Dans le cadre d'un projet sur l'apport des technologies de NLP pour le domaine de la santé, nous proposons un stage afin de mettre au point un système de détection des intentions suicidaires à partir de messages écrits sur les réseaux sociaux. Pour cela, nous nous baserons sur une étude réalisée par l'INSERM, sur l'expression du mal-être et des intentions de suicide. Le stage consistera donc à implémenter les résultats de l'étude dans notre système, pour le français mais aussi pour l'anglais, ainsi que de participer à la réalisation du produit final, qui générera des alertes en fonction du degré d'urgence exprimé dans les messages. Le stage se découpera de la manière suivante : * Enrichissement de l'ontologie métier de GEOLSemantics pour la détection des intentions suicidaires, * Enrichissement des analyses anglais et français afin d'extraire tous les critères nécessaires, * Mise en place du calcul de probabilité permettant de classer les messages arrivants selon ce qu'ils contiennent (RAS, état inquiétant, état urgent), * Mise en place du processus d'alerte pour les états inquiétants et urgents, * Test sur un corpus représentatif. Il sera aussi demandé, à chaque phase, de réaliser la documentation nécessaire. Formation Master en informatique et linguistique Langues Français et anglais Autres langues bienvenues Environnement technique * Méthodologie Agile (Scrum) * Outils * Gestion de versions (SVN) * Gestion de production (Maven) * Intégration continue (Jenkins) * Environnement de développement (Eclipse et/ou Netbeans) * Développement (Python, Java) * Base de données (SGBD-R, NO SQL, Base de connaissance, web sémantique) * Format d'échange (XML, RDF) * Système d'exploitation (Windows, Linux) Autres compétences * Autonomie * Bonne aisance rédactionnelle * Capacité à communiquer avec les membres de l'équipe Caractéristiques du stage * Durée : minimum 6 mois * Date de début : avril 2020 * Lieu : Gentilly Pour postuler, envoyez votre candidature à christian.fluhr@geolsemantics.com www.geolsemantics.com