Sujet: Extraction non supervisée de relations syntaxiques profondes à partir de corpus = La société Yseop est l'éditeur international d'un logiciel d'Intelligence Artificielle spécialisé dans la génération automatique de texte en langage naturel (Natural Language Génération ou NLG). Nous offrons une solution qui raisonne, dialogue et rédige comme un être humain, en plusieurs langues, et qui se concentre sur deux coeurs d'expertise : la génération automatique de rapports et la relation clients. Aujourd'hui, nous comptons plus de 50 000 utilisateurs quotidiens de la technologie Yseop, principalement des entreprises du CAC 40 et du Fortune 500. = La mission L'objet du stage est de réaliser un analyseur de corpus extrayant des relations syntaxiques profondes (et leur arguments) liées à des prédicats donnés dans des corpus client. Cette extraction servira d'entrée à un processus d'apprentissage qui permettra l'adaptation des grammaires de génération à un contexte applicatif spécifique. On pourra par exemple se baser sur des approches comme UCCA (Universal Conceptual Cognitive Annotation) ou FrameNet. La langue des documents est l'anglais mais le prototype réalisé devra être aisément portable sur d'autres langues, en premier lieu le français. Cette mission se déroulera au sein de l'entité Yseop Lab, en étroite collaboration avec les équipes travaillant sur l'apprentissage et l'analyse automatique des langues. = Le profil recherché Vous avez un niveau M2 en TAL, avec de bonnes connaissances en programmation, en particulier en Python avec des outils TAL associés (Spacy, NLTK). Des connaissances en bases de données, en modélisation des données et en apprentissage automatique seront appréciées. Le stage se déroule dans les locaux de la société, à Paris (75001), pour une durée de 6 mois à partir de début Janvier 2019. = Pour postuler Rendez-vous sur la page https://www.welcometothejungle.co/companies/yseop/jobs/stage-nlp-analyse-de-corpus_paris