Fiche de poste - assistant(e) de recherche Titre : Ingénieur pour la structuration de corpus de communications en ligne Lieu de travail : Laboratoire de Recherche sur le Langage (LRL), EA999 Université Blaise Pascal Maison des Sciences de l'Homme 4, rue Ledru 63057 Clermont-Ferrand cedex 01 Toile : http://lrl.univ-bpclermont.fr Qualification et compétences appréciées : - Compétences pour le travail en groupe au sein d'un projet national - Expérience en XML et schémas associés - Expérience dans les langages de transformation de corpus (XSLT...) - Connaissance des schémas de structuration de corpus du type TEI - Expérience appréciée dans des langages de programmation de traitement de chaînes type Perl, Python - Maîtrise appréciée de l'anglais niveau B2 minimum. Tâches : - Structuration de corpus existants sur des communications médiées par les réseaux en TEI - Contribution au choix des structures de TEI adaptées aux types de corpus - Traitements d'anonymisation simples sur les corpus bruts - Aide à la collecte automatique de nouveaux corpus en ligne. Type de contrat : Contrat CDD niveau ingénieur d'étude de 6 mois à temps plein (juin-novembre 2013). Prolongation du contrat sur 2014 à discuter Salaire mensuel : 1700 euros brut, 1350 euros net Descriptif de la mission : CoMeRe est un projet national (http://corpuscomere.wordpress.com) du groupe de travail sur les nouvelles formes de communication du consortium corpus-écrits (http://corpusecrits.corpus-ir.fr/ ). Il a pour but de collecter et mettre en ligne des corpus de Communication Médiée par les Réseaux (CoMeRe - CMC en anglais) suivant les standards internationaux, à horizon 2014 sur le site Ortolang. Ce noyau de corpus sera alors intégré au futur Corpus de Référence du français. Le projet rassemble des chercheurs appartenant à une dizaine d'unités nationales différentes. Il est coordonné au sein de l'unité LRL. CoMeRe a reçu le soutien de Corpus-écrits et de l'équipement d'excellence Ortolang (http://www.ortolang.fr ). La personne recrutée travaillera en contact permanent avec les chercheurs de CoMeRe qui déposeront leurs corpus sur les serveurs du LRL. Elle aura pour tâche principale de les structurer suivant les standards adoptés par le projet en partenariat avec nos partenaires européens au sein du consortium TEI. Elle participera à la collecte de nouveaux corpus en ligne et aux réunions du projet. Candidature : Lettre de motivation + CV Contact Thierry Chanier - Thierry.CHANIER@univ-bpclermont.fr