STAGE EN LINGUISTIQUE INFORMATIQUE Contexte ******** Outil d'aide aux linguistes (OAL) pour le développement de ressources linguistiques multilingues & Linguistic Object Language (LOL) pour l'écriture des grammaires pour l'extraction d'information. L'un des aspects clés des applications en Traitement Automatique des Langues est lié à la qualité de ressources linguistiques sur lesquelles celles-ci s'appuient. A priori les ressources sont toujours perfectibles, mais son enrichissement et raffinement est un processus coûteux et parfois assez fastidieux pour les linguistes. Le but d'OAL est justement de rendre cette tâche plus productive et surtout, de faciliter le contrôle de la qualité (test de régression, gestion des questions liées aux ressources multilingues). Sujet du stage 1) Développement des lexiques morphosyntaxiques SylLex et des lexiques SylThème dans OAL, outil d'aide aux linguistes conçu pour le développement de ressources linguistiques ainsi que définition et participation à la mise en place des ressources et procédures nécessaires pour l'alimentation semi-automatique de l'outil. 2) Écriture des règles d'extraction d'information dans un environnement multilingue. Langues possibles ****************** allemand, danois, chinois, néerlandais, polonais, portugais, russe, suédois ou tchèque. Objectifs du stage ****************** La personne recrutée pour ce stage aura deux tâches principales : 1) Le développement et l'intégration des lexiques morphosyntaxiques et thématiques de Syllabs dans une des langues listées en haut dans OAL, notre outil d'aide aux linguistes conçu pour le développement de ressources linguistiques. La phase de développement des lexiques implique la création des ressources et procédures semi-automatiques nécessaires pour alimenter le lexique tout en assurant leur qualité (création de corpus, définition des critères linguistiques pour le crawling conditionnel, définition du jeux d'étiquettes morphosyntaxiques suivant les conventions du formalisme SylLex, définition des tests de régression, évaluation quantitative et qualitative des lexiques, évaluation de la couverture). 2) L'écriture des grammaires pour l'extraction d'information avec LOL, un langage de programmation linguistique développé à Syllabs. Connaissances souhaitées ************************ Étudiant(e) en Linguistique Informatique, Traitement Automatique des Langues. Très bonne maîtrise de la morphologie. Très bonne maîtrise de PERL ou Python et Unix. Expérience avec Intex ou Nooj serait un plus. Merci d'envoyer votre candidature à l'adresse suivante : jobs /arrobas/ syllabs .com tout en indiquant dans l'objet du mèl « stage en linguistique informatique ».