Lien : https://profilsdemplois.cnrs.fr/index_public_referens?destination=CE2022 Concours n°103, 2e poste 2eme poste du concours N° 103 *Affectation :* Appui à la Recherche et à la DIffusion des Savoirs, VILLEJUIF *Groupe de fonction :* Groupe 3 *Mission :* L'ingénieur.e en ingénierie logicielle sera basé.e au sein de l'UAR ARDIS pour réaliser et mettre en place des logiciels et outils dans le cadre des projets scientifiques du SEDYL et du LLACAN, situées sur le Campus CNRS de Villejuif. Il/elle assurera en particulier le traitement de corpus linguistiques et multilingues, corpus écrits comme oraux (audio/vidéo) pour des langues peu décrites ou rares, ainsi que la création et l'amélioration d'outils numériques pour l'exploitation scientifique de ces corpus. *Activités :* Assurer le développement d'outils informatiques spécifiques pour traiter des corpus linguistiques et multilingues, écrits et oraux (ex : concordanciers, dictionnaires automatiques, outils de fouille de données, représentation formelle des langues etc.) et les doter ainsi d'outils informatiques véritablement innovants. - Analyser les besoins des utilisateurs, les traduire en spécifications techniques. - Concevoir et développer des applications et outils pour les projets du SEDYL et du LLACAN. - Assurer la maintenance évolutive et curative des développements réalisés - Rédiger les documentations techniques et fonctionnelles - Assister les utilisateurs (formations et suivi de projets) - Assurer la veille technologique, suivre les évolutions des normes et standards du domaine (linguistique de corpus, annotation de ressources linguistiques, fouille de données hétérogènes) - Assurer le développement de formats permettant d'assurer l'interopérabilité des ressources. - Assurer la gestion des données et archives de la recherche et leur valorisation. *Compétences :* Savoirs : - Maîtrise des méthodes d'analyse, de modélisation et de développement (UML,...) - Maîtrise de langages de développement et de script (php, python, java,...) - Connaissance des problématiques de la représentation des données linguistiques, de l'enregistrement et de la manipulation de corpus (XML, XSLT,...) Savoirs faire : - Maîtriser les bases de données relationnelles - Maîtriser les formalismes d'encodage, d'annotation et de traitement de l'information dans les chaînes documentaires XML (XML, XML Schema, XSLT, XPath) - Maîtriser les méthodes et techniques de la programmation web (HTML/CSS, Javascript, PHP,...) - Connaissance d'un outil de traitement linguistique (ex : ELAN) appréciée - Connaissance des référentiels de bonnes pratiques (CMMI, ITIL) et de sécurité, accessibilité et interopérabilité (RGS, RGAA, RGI, RGPD) - Connaissance de l'anglais technique écrit du domaine, et capacité à communiquer à l'oral (écrit niveau B2, oral niveau B1). Savoirs-être : - Aptitude à travailler en équipe, en particulier au sein de projets collaboratifs - Aisance pour les interactions avec les chercheurs et adaptation aux pratiques de la recherche - Rigueur - Force de proposition - Curiosité, adaptabilité, bonne culture générale en linguistique *Contexte :* Le poste sera basé au sein de l'UAR2259 ARDIS, dans le service informatique. Le poste est mutualisé entre le SEDYL et le LLACAN, unités de recherche en linguistique de terrain situées sur le Campus CNRS de Villejuif. La personne recrutée dépendra administrativement et hiérarchiquement de l'unité ARDIS et participera à la vie de cette unité. Elle sera chargée préférentiellement de projets du SEDYL et du LLACAN. Pour chacun de ces projets, issus des activités de recherche sur corpus de ces unités (description des langues, théorisation, description des contacts de langues), la personne recrutée sera intégrée aux équipes de recherche correspondantes. Elle assurera le développement d'outils informatiques spécifiques pour traiter ces corpus (ex : concordanciers, dictionnaires automatiques, outils de fouille de données, représentation formelle des langues, etc) et offrir ainsi aux équipes et à la communauté scientifique des outils informatiques innovants.