L'UCLouvain recherche un (h/f) Gestionnaire de données - taux d'emploi à convenir (entre 50% et 100%) pour une durée déterminée de 12 mois (avec possibilité de prolongation) - pour l'Institut Langage et Communication (ILC), du Secteur des Sciences Humaines (SSH) - à Louvain-la-Neuve - entrée en fonction: début 2023 Contexte La recherche actuelle fait un usage massif de données langagières écrites et orales, dans différentes langues (français, espagnol, anglais, néerlandais, etc.). Pour être exploitables, ces données langagières doivent être documentées (métadonnées), anonymisées (afin de respecter les règles sur les données personnelles), enrichies d'annotations (transcription, indexation, analyse thématique, etc.) et déposées dans des bases de données interrogeables en ligne. C'est à ces différentes tâches que le ou la gestionnaire de données contribuera au sein de l'Institut Langage et Communication (ILC), et plus particulièrement du Pôle de recherche en Linguistique (PLIN) et de la plateforme CENTAL (Centre de Traitement Automatique du Langage). Fonction En collaboration avec les chercheurs de PLIN/ILC, le ou la gestionnaire de données a pour fonctions de : - Superviser la chaine de traitement de constitution des corpus oraux et écrits (acquisition des données, documentation des métadonnées, transcriptions et annotations, versement dans les bases de données existantes, standardisation des formats utilisés) - Développer des outils de prétraitement et de traitement des données (segmentation, alignement du texte au son, alignement texte-texte, annotation automatique ou semi-automatique, etc.) - Assurer une veille technologique pour l'interopérabilité des données (documentées et traitées selon les standards internationaux, cf. Clarin, Ortolang, Olac, etc.) et l'amélioration de l'acquisition des données (automatic speech recognition, tokenisation, etc.) - Veiller au respect des conventions juridiques et éthiques liées à la protection des données (e.g. RGPD) et à la publication des données (e.g. Dataverse) - Représenter l'UCLouvain dans différents consortiums internationaux des données en linguistique. - Assurer le suivi des demandes d'information et de support effectuées auprès de notre future centre K CLARIN sur les corpus d'apprenants Qualifications et aptitudes requises Le ou la candidat.e répondra aux qualifications suivantes : - titulaire d'un diplôme de Master en Sciences du langage, Traitement automatique du langage ou Linguistique - compétences de programmation : Perl et/ou Python, bonne connaissance du XML - capacité à traiter des données langagières dans au moins 2 de ces langues (français, anglais, néerlandais, espagnol, allemand, etc.) - connaissance de l'anglais (B2) et en particulier de l'anglais académique (pour participer à des réunions internationales et contribuer aux publications de recherche) - sens du travail en équipe, capacité d'écoute et d'analyse des besoins, réactivité - des notions en statistiques linguistiques constituent un plus Votre candidature (fichier unique avec lettre de candidature, curriculum vitae) est à transmettre pour le 10 janvier à l'adresse suivante: magali.paquot@uclouvain.be Sur base de ces documents, les candidat-e.s seront, le cas échéant, sélectionné-e.s pour un entretien qui se fera durant la deuxième quinzaine de janvier.