Proposition de stage Sujet: Développement d'une API de catégorisation de textes courts. Type de poste : Stage 6 à 12 mois Lieu de travail : Succeed Together, 60 bis rue de Rochechouart, 75009 Paris Contexte Au sein du pôle recherche et développement de l'entreprise Succeed Together, nous orientons nos recherches sur le regroupement sémantique ultra rapide de messages courts. Dans le domaine de l'analyse de textes, Succeed Together recherche un/une stagiaire pour travailler sur des techniques de classification (supervisée et non supervisée ) de messages courts : - classification par polarité : Il s'agit pour des messages courts, de juger de leur subjectivité dans un premier temps, et de détecter leurs polarités (positive/négative) dans un second temps. - classification par thématique : Il s'agit ici pour des messages courts d'identifier leurs thématiques associées. C'est l'exemple de messages "être proche de son client" et "privilégier la proximité" qui appartiennent à la thématique "proximité avec les clients". Objectifs A partir de messages courts provenant de plusieurs sources (réponses à des questions, réseaux sociaux, ...), pouvant être de langues différentes, l'application visée a pour but de regrouper automatiquement, de produire une classification par thématique et/ou par polarité. La tâche du stagiaire consistera donc en particulier à : - Étudier et tester les algorithmes de classification par thématique (respectivement par polarité) des messages courts ; - Assister les développeurs dans la mise en place de l'API ; - Évaluer les différentes solutions sur des données de référence ; Profil recherché: - Compétences en traitement automatique des langues / recherche d'information / mesures de similarité textuelle - Connaissances des techniques de clustering / classification - Langage de programmation utilisé: python, java - Compétences en statistique seraient un plus Les candidats intéressés doivent envoyer un email de candidature à gdurand@succeed-together.eu avec un CV détaillé (pdf) et une lettre de motivation.