La BULAC recrute un ingénieur d'étude pour un CDD de 9 mois à compter de septembre. La personne recrutée travaillera au sein du pôle Flux et Données de la BULAC sur le projet TransliTAL, en collaboration avec ERTIM/Inalco (Damien Nouvel, Ilaine Wang). Intitulé du poste : chargé de projet TransliTAL Rattachement : Pôle Flux et données / Équipe Signalement et exposition des données Catégorie-corps-grade : A - IGE Ingénieur d'études contractuel BAP E (sur crédits fléchés) CONTEXTE La Bibliothèque universitaire des langues et civilisations (BULAC) met à disposition des étudiants et chercheurs des collections d'excellence pour les études aréales, et ce dans une grande diversité de langues, systèmes d'écriture et supports. En son sein, le pôle Flux et données est en charge de la gestion et du signalement des acquisitions documentaires ainsi que de la diffusion des données et de l'informatique documentaire. Dans le cadre de l'appel à initiatives 2023 du programme de coopération de l'Agence bibliographique de l'enseignement supérieur (Abes), la BULAC a vu son projet TransliTAL sélectionné. Ce projet sera mené en partenariat avec le laboratoire ERTIM de l'Inalco et court sur la période 2024-2025 TransliTAL vise à développer un outil d'aide à la correction des translittérations et transcriptions erronées présentes dans les notices du Sudoc, le catalogue collectif de l'enseignement supérieur. Il vise également à compléter les notices plus anciennes lorsque l'écriture originale est absente et à faciliter le travail courant de production de notices en bi-écriture. L'outil développé s'appuiera sur les techniques de traitement automatique des langues (TAL) et sera appliqué sur plusieurs corpus linguistiques : - les langues à écriture arabo-persane : arabe, persan, ourdou, turc ottoman ; - les langues à écriture cyrillique : russe, ukrainien, biélorusse, serbe, bulgare, langues d'Asie centrale, de Mongolie ; - les langues utilisant (entre autres scripts) les sinogrammes : chinois, japonais, coréen, viêtnamien chu nôm. ACTIVITÉS Au sein de l'équipe Signalement et exposition des données (pôle Flux et données), sous la responsabilité du chef d'équipe et en étroite relation avec le laboratoire ERTIM (équipe de recherche textes, informatique, multilinguisme), le chargé de projet TransliTAL aura pour mission de : - Établir un état de l'art des normes et évaluer les méthodes de translittération existantes ; - Constituer les données d'apprentissage à partir des notices en collaborant avec les catalogueurs spécialistes des langues concernées ; - Développer les modèles de langue nécessaires au projet en s'appuyant sur l'existant et veillant à appliquer les normes de translittération/transcription en vigueur dans le Sudoc pour chaque langue ; - Mettre en place et évaluer les algorithmes d'apprentissage et superviser le processus d'active learning jusqu'à l'obtention d'un résultat satisfaisant ; - Participer à la définition des développements nécessaires pour la création de l'outil de translittération/transcription automatisée (livrable final du projet). Le chargé de projet sera associé à tous les aspects du suivi du projet TransliTAL : - Participation aux réunions de pilotage bimestrielles associant la BULAC et le laboratoire ERTIM ; - Participation à l'animation des réunions de travail et datathons associant catalogueurs de la BULAC et du réseau Sudoc ; - Présentation des travaux menés et livrables réalisés dans le cadre du projet. Le chargé de projet participera aux réunions d'équipe hebdomadaires de l'équipe Signalement et exposition des données. COMPÉTENCES RECHERCHÉES Compétences techniques - Compétences informatiques en Traitement Automatique des Langues : méthodes de traitement, collecte et gestion de corpus, algorithmes d'apprentissage automatique - Maîtrise des langages informatiques (Python, PHP, Javascript) - Connaissances appréciées sur l'encodage, notamment en Unicode - Maîtrise de l'anglais à l'écrit et à l'oral (la maîtrise d'une autre langue parmi celles représentées dans les collections de la BULAC serait un plus) - Maîtrise des outils bureautiques Aptitudes - Aptitude à la conduite de projets - Sens de l'organisation et de l'analyse - Capacité à travailler en équipe (au sein de l'équipe SED et en collaboration avec les autres pôles de la BULAC) - Capacité à rendre compte de ses activités et à communiquer - Rédaction de notes techniques et formalisation de procédures - Capacité à travailler de manière autonome LIEU DE TRAVAIL BULAC, Pôle des langues et civilisations, 65 rue des Grands Moulins, 7 5013 PARIS http://www.bulac.fr/ CONDITIONS DE RECRUTEMENT Type d'emploi : IGE Contractuel Prise de poste : 01/09/2024 Durée du contrat : 9 mois Quotité de travail hebdomadaire : 100 % (35 h/semaine) Congés : calculés sur la base de 52 jours pour une année à temps complet Rémunérations : selon grille indiciaire du corps des IGE avec prise en charge partielle des frais de transports et de restauration Télétravail : 1 jour par semaine (au bout de 6 mois sur le poste) CONTACT Les dossiers de candidature (CV, lettre de motivation) sont à envoyer à l'adresse donnees@bulac.fr dès que possible et avant le 15 juillet 2024 .