Sujet de Stage : Extraction et typage des Entités Nommées en anglais Contexte : Créé en 2009, GEOLSemantics est un éditeur de logiciels innovants dans le domaine des technologies de l'information et de la communication, et particulièrement dans les domaines de la linguistique et de la sémantique. Les solutions de GEOLSemantics analysent les contenus textuels pour identifier, normaliser et structurer les données pertinentes qu'ils contiennent, afin de les rendre directement exploitables par des processus automatiques. Objectifs du stage : Dans le cadre d'un projet de recherche dans le domaine de la sécurité, nous souhaitons améliorer la reconnaissance des Entités Nommées (principalement organisations, lieux et personnes) en anglais, pour les textes issus de comptes-rendus d'opérations ou de mains-courantes. Nous nous appuierons pour cela sur la solution d'analyse linguistique de GEOLSemantics, qui utilise l'IA symbolique via des ressources linguistiques et des règles, ainsi que sur le traitement du français déjà en place. La mission principale du stage sera donc de mettre au point la reconnaissance des Entités Nommées en anglais en enrichissant les ressources existantes et en participant à l'élaboration des règles d'extraction des Entités Nommées. Tâches principales à réaliser : - Prise en main du système de GEOLSemantics - État de l'art sur la reconnaissance des Entités Nommées - Réalisation d'un corpus de test et d'une référence - Reconnaissance des Entités Nommées de lieux - Reconnaissance des Entités Nommées de personnnes - Reconnaissance des Entités Nommées d'organisation - Évaluation des résultats - Réalisation de la documentation technique Profil recherché : - Étudiant(e) en Master de Linguistique Informatique, Traitement automatique des langues ou Traduction - Langues : anglais, français, autres langues bienvenues - Connaissance d'un langage de script (Python, Perl, etc) - Connaissances en Java, Linux et GIT appréciées Autres compétences : - Autonomie - Bonne aisance rédactionnelle - Bonne capacité de communication et aptitude pour le travail en équipe Caractéristiques du stage : - Durée : minimum 6 mois - Date de début souhaitée : avril 2022 - Lieu : Le Kremlin-Bicêtre Pour postuler, envoyez votre candidature à aurelie.rossi@geolsemantics.com en indiquant dans l'object du mail "stage sur la reconnaissance des Entités Nommées en anglais"