Durée, démarrage D'une durée de 6 mois, le stage se déroulera dans les locaux du centre R&D à Montpellier. Démarrage dès que possible. Présentation de l'entreprise Société du Groupe CNIM, Bertin IT est un éditeur et intégrateur de solutions logicielles pour la cyber sécurité, la cyber-intelligence, la veille stratégique et le traitement automatique de la parole. Sa marque AMI, leader dans l'édition de logiciels d'acquisition, de gestion et de traitement de l'information texte issue du Web, offre des solutions de veille stratégique et d'intelligence compétitive. En particulier, notre solution, AMI Enterprise Intelligence, permet aux entreprises d'exploiter le Big Data afin d'anticiper les évolutions de leur environnement concurrentiel et technologique et d'identifier de nouvelles perspectives de développement. Description du stage Dans le cadre de notre solution AMIEI (AMI Enterprise Intelligence), nous proposons des outils avancés d'analyse de texte en vue de faciliter aux veilleurs et analystes l'exploitation et la navigation dans l'importante masse de documents collectés à l'issue du processus de veille. Divers traitements sont proposés tels que l'extraction des principales thématiques, l'identification des entités nommées ainsi que les concepts clés apparaissant dans les documents. Votre mission principale sera de développer un module d'extraction d'événements de type « rachat d'entreprise ». Ce choix découle de l'intérêt de nos clients d'étudier la présence d'un tel événement dans différents médias afin d'avoir une vision générale de leur marché et de maintenir automatiquement à jours leur base de connaissance sur les différents acteurs de ce marché. Ce module d'extraction se basera sur un corpus de textes issus de différents médias référents à la notion de rachat (à construire), sur l'utilisation de FrameNet pour la définition des arguments de l'événement «rachat» dans les médias analysés, et une approche hybride pour l'extraction des événements. Cette approches hybride consistera à voir quel serait le meilleur algorithme d'apprentissage pouvant prendre en compte les relations de dépendances syntaxiques existant entre les différents arguments d'un événement. La langue cible est l'anglais. Mots clés : TALN, Deep learning, Réseaux de neurones, Extraction d'événement, rôles thématiques, extraction d'informations Profil souhaité Vous êtes actuellement en dernière année d'école d'Ingénieur (ou cursus universitaire en mathématiques appliquées, statistiques ou data science, linguistique informatique). Vous avez une appétence pour le traitement du langage naturel et les méthodes d'apprentissage. Une bonne connaissance d'au moins un langage de script tel que R, Python ou autre est indispensable ainsi qu'une bonne connaissance d'outils de NLP tel que Standford parser et librairie de deep learning telle que Torch ou Tensorflow. Vous êtes également reconnu(e) pour votre rigueur et votre dynamisme. Vous êtes enthousiaste à l'idée de contribuer au développement de notre activité, rejoignez-nous ! Si vous êtes intéressé(e) merci d'envoyer votre Cv et lettre de motivation à : sabrina.pagel@bertin.fr et frederique.segond@bertin.fr