*Offre d'emploi* Le Congrès permanent de la langue occitane recrute un/une Développeur/Développeuse Lieu de travail : travail en réseau depuis un des bureaux du Congrès ou des institutions partenaires. Nature et durée de contrat de travail : CDI de projet. Durée de travail hebdomadaire : 35 heures. Début du contrat : septembre 2024. Salaire : selon expérience. */ Présentation du projet* Le Congrès permanent de la langue occitane a engagé dans le cadre du nouveau Contrat de plan de État-Région (CPER) un programme de création de *plateforme lexicale, textuelle et toponymique*. Il s'agit d'un outil innovant et interactif d'accès unique à l'ensemble des données linguistiques (dictionnaires, grammaire, phonologie, corpus textuels, toponymie, etc.), sa création comprend également la rédaction du Dictionnaire général informatisé de la langue occitane ainsi qu'un plan de restauration toponymique en partenariat avec l'IGN (dont le Congrès est devenu référent pour la restitution et la normalisation des formes toponymiques occitanes). Un volet dédié à la constitution massive de ressources TAL (Traitement automatique des langues), avec le formatage et l'annotation des corpus lexicographiques et textuels, est également prévu. Soutenu par les régions Auvergne-Rhône-Alpes, Nouvelle-Aquitaine et Occitanie ainsi que l'État (ministère de la Culture, DRAC Nouvelle- Aquitaine et Occitanie), ce programme pluriannuel (2024-2027) permettra le développement d'une infrastructure numérique d'excellence - inspirée du portail linguistique du français, le CNRTL (http://www.cnrtl.fr), une référence en la matière - qui bénéficiera à tous les usagers de la langue, au grand public, aux chercheurs, aux élèves et étudiants, aux enseignants et formateurs ainsi qu'aux collectivités. Comme pour ses langues voisines - basque, espagnole, catalane et française - l'occitan sera ainsi doté grâce à ce programme d'un *dictionnaire monolingue descriptif complet*, embrassant toutes ses variétés, avec description phonologique, acceptions, définitions, exemples, dictons, proverbes, citations littéraires, etc.. Il s'agit d'un travail de plusieurs années, nécessitant une équipe fournie dans le domaine de la lexicographie, qui aura une édition numérique permettant sa plus large diffusion grâce aux standards d'interopérabilité. Une édition papier en plusieurs volumes pourra être ultérieurement envisagée. Cette oeuvre académique de prestige est indispensable à la connaissance et à la diffusion de la langue. En effet, depuis le Tresor dóu Felibrige de Frédéric Mistral, aucune oeuvre lexicographique panoccitane de ce niveau scientifique et de cette envergure n'a été produite à ce jour. Il s'agit donc d'un chantier historique mobilisant l'ensemble des connaissances, des ressources et des compétences scientifiques et techniques en langue d'oc. */ Descriptif du poste* Sous la direction de la responsable du pôle informatique et au sein d'une équipe de lexicographes, vous participerez aux travaux de : - Formatage de lexiques et dictionnaires du Congrès (XML, norme TEI-P5). - Formatage de corpus textuels (monolingues, bilingues, audio transcrits). - Génération automatique ou semi-automatique de lexiques (extraction de synonymes, génération de formes fléchies, correction et croisement de données). - Data mining (extraction de données pour traitement lexicographique). - Participation à la construction d'outils TAL, web ou mobiles (règles de désambiguisation, selon profil réalisation de site web, plug-in et applicatifs). - Rédaction du cahier des charges et suivi des prestataires. - Rédaction des notices et production des tutoriels Vous serez appuyé dans votre mission par l'équipe technique du Congrès. */ Description du profil* De formation supérieure, vous maîtrisez la programmation Python axée sur le traitement des données textuelles (notamment XML). Vous êtes à l'aise dans un environnement Linux ainsi qu'avec l'utilisation des lignes de commande. Vous maîtrisez la gestion des données SQL ainsi que les formats CSV, HTML et XML. Selon le profil, une connaissance de la norme TEI-P5, de frameworks de type modèle-vue-contrôleur (de préférence Django) ou de PHP, JavaScript et/ou React Native seraient un plus. Vous êtes méthodique et rigoureux, vous avez une exigence quant à la qualité de vos travaux. Votre esprit d'initiative et votre autonomie, doublés d'un solide engagement personnel sont de réels atouts. Vous êtes force de proposition. Vous êtes à l'aise en réunion ainsi que dans les groupes de travail. Vous maîtrisez les outils bureautiques et collaboratifs, vous avez une appétence pour l'innovation et le numérique. Vous souhaitez rejoindre une équipe dynamique, au sein d'un réseau scientifique et technologique européen, développant des applications de pointe pour la langue occitane. Vous êtes prêt à vous engager pour plusieurs années sur un chantier TAL historique pour l'occitan. */ Le Congrès permanent de la langue occitane* Le Congrès permanent de la langue occitane est l'organisme interrégional de régulation de l'occitan. Installé dans trois sites (Nouvelle-Aquitaine, Occitanie et Auvergne-Rhône-Alpes), il rassemble les institutions et fédérations historiques du territoire occitanophone et il est soutenu par le ministère de la Culture et les collectivités territoriales. Institution académique, il a pour mission de contribuer à la vitalité et au développement de l'occitan - appelé aussi langue d'oc - en travaillant à sa connaissance et à sa codification par la production des outils concernant les différents aspects de la langue (la lexicographie, la lexicologie, la terminologie, la néologie, la phonologie, la graphie, la grammaire et la toponymie). Le Congrès est éditeur de la plate-forme numérique - dicodoc.eu - rassemblant différents outils linguistiques de référence : un multidictionnaire occitan, un conjugueur, une base terminologique, une base toponymique, des synonymes, un corpus textuel ainsi que des applications mobiles. Fort d'une équipe de permanents, de son Conseil linguistique et de son réseau de partenaires, il a développé une expertise dans le domaine du TAL (traitement automatique de la langue). Il pilote à ce titre la Feuille de route de développement numérique de l'occitan, un document-cadre de planification et de création de ressources et d'outils en technologies langagières. Membre du consortium européen LINGUATEC, il est éditeur de la première synthèse vocale (votz.eu) et du traducteur automatique (revirada.eu) en occitan, et développe actuellement la reconnaissance vocale (ReVÒc). *DÉPÔT DES CANDIDATURES :* *Les candidatures sont ouvertes jusqu'au 15 juin 2024. Le dossier de candidature est composé d'un CV et d'une lettre de motivation à envoyer par voie dématérialisée à : b.dazeas@locongres.org*