Évaluation d'outils d'extraction d'entités nommées Durée, démarrage D'une durée de 6 mois, le stage se déroulera dans les locaux du centre R&D à Montpellier. Démarrage dès que possible. Présentation de l'entreprise Société du Groupe CNIM, Bertin IT est un éditeur et intégrateur de solutions logicielles pour la cyber sécurité, la cyber-intelligence, la veille stratégique et le traitement automatique de la parole. Sa marque AMI, leader dans l'édition de logiciels d'acquisition, de gestion et de traitement de l'information texte issue du Web, offre des solutions de veille stratégique et d'intelligence compétitive. En particulier, notre solution, AMI Enterprise Intelligence, permet aux entreprises d'exploiter le Big Data afin d'anticiper les évolutions de leur environnement concurrentiel et technologique et d'identifier de nouvelles perspectives de développement. Description du stage Dans le cadre de notre solution AMIEI (AMI Enterprise Intelligence), nous proposons des outils avancés d'analyse de texte en vue de faciliter aux veilleurs et analystes l'exploitation et la navigation dans l'importante masse de documents collectés à l'issue du processus de veille. Divers traitements sont proposés tels que l'extraction des principales thématiques, l'analyse de sentiment ou la détection des événements clés. Nous fournissons en particulier des outils permettant l'identification des entités nommées ainsi que les concepts clés apparaissant dans les documents. Une entité nommée (Named Entity) faisant référence à une personne ou tout autre objet du monde réel pouvant être désigné par un nom propre (lieu géographique, nom d'organisation, nom d'une marque, d'un produit, etc.). Ce type de problématique est désigné sous la dénomination NER (Named entity Recognition. Dans ce cadre et dans le but d'une amélioration de nos outils NER existants, nous souhaitons tester et évaluer des approches basées sur des réseaux de neurones. La mission consiste à sélectionner des outils OpenSource permettant d'implémenter des réseaux de neurones (Tensorflow, Theano ou autre), construire des modèles NER à base de ces outils, évaluer et comparer les modèles construits avec les outils AMI ainsi que des outils de référence comme Stanford NER. Les langues cibles de l'étude sont l'Anglais et le Français. Mots clés Deep learning, Réseaux de neurones, Benchmark, Extraction d'entités nommées, NER, Mesures d'évaluation, Profil souhaité Bac +4/5, vous êtes issu(e) d'une école d'ingénieur ou suivez un Master en mathématiques appliquées, statistiques ou data science. Vous avez une appétence pour les statistiques et le data science. Une bonne connaissance d'au moins un langage de script tel que R, Python ou autre est indispensable. Pour cette mission, l'autonomie, le dynamisme ainsi le sens de la rigueur seront particulièrement appréciés. Si vous êtes intéréssé(e) merci d'envoyer votre Cv et lettre de motivation à : Leila.khouas@bertin.fr et frederique.segond@bertin.fr