Sujet : Etude, spécification et développement d'un système d'extraction de relations entre entités nommées. Date de démarrage : février/mars 2008 Durée : 6 mois Niveau : Master en TAL Contexte -------- Dans le cadre de ses travaux de R&D, Arisem a créé un nouveau moteur d'analyse sémantique et d'extraction d'information. Afin d'améliorer sa pertinence, nous travaillons actuellement sur l'extraction de relations sémantiques entre entités nommées. Contenu du stage ---------------- D'une durée de 6 mois, ce stage est consacré à l'étude de la problématique concernant l'extraction de relations et des différentes approches existantes. Par la suite, le stagiaire sera amené à participer au développement des ressources pour l'acquisition de relations à partir d'un corpus de textes. En collaboration avec les équipes R&D d'Arisem, le travail du stagiaire sera découpé en trois phases : - Compréhension de notre problématique d'extraction ; - Etude et compréhension des différentes approches existantes pour l'extraction de relations ; - Participation au développement du système d'acquisition de relations entre entités nommées. Profil recherché ---------------- Etudiant en dernière année de master en traitement automatique des langues, le candidat doit avoir de bonnes connaissances en informatique et des logiciels de traitement automatique des langues (Unitex, Gate, etc.). Les candidatures sont à adresser à : nicolas.dessaigne@arisem.com aurelie.migeotte@arisem.com