Stage en TAL, Analyse syntaxique de l'arabe Contexte : Créé en 2009, GEOLSemantics est un éditeur de logiciels innovants dans le monde des technologies de l'information et de la communication et particulièrement dans les domaines de la linguistique et de la sémantique. Les solutions de GEOLSemantics analysent les contenus des textes pour identifier, normaliser et structurer les données pertinentes contenues dans les textes pour les rendre directement utilisables par des processus automatiques apportant les réponses appropriées aux objectifs métiers. Objectifs de lamission Dans le cadre d'un projet de recherche l'entreprise GEOLSemantics propose un stage dans le traitement automatique de la langue arabe. La mission principale sera de mettreau point l'analyse morphosyntaxique profonde de l'arabe en enrichissant les ressources existantes et en participant à l'élaboration des règles de désambiguïsation et des règles syntaxiques pour son intégration dans l'outil d'extraction d'information existant. Tâches principalesà réaliser - Prise en main du système de GEOLSemantics - Amélioration de la désambiguïsation - Élaboration de règles pour l'analyse syntaxique - Reconnaissance des entités nommées - Réalisation des tests et de la documentation technique Profil recherché - Étudiant(e) en Linguistique Informatique, Traitement automatique des langues ou Traduction - Langue maternelle : arabe - Bonne capacité de communication et aptitude pour le travail en équipe - Connaissance d'un langage de script (Python, Perl, etc) - Connaissances en Linux et SVN appréciées Conditions - Stage conventionné de 5 à 6 mois rémunéré - Remboursement à moitié du pass Navigo (transport) Merci d'envoyer votre candidature à l'adresse christian.fluhr@geolsemantics.comet en indiquant dans l'objet du mail « stage en traitement de l'arabe ». Lieu : Gentilly.