Ingénieur·e d'étude en humanités numériques CELLF / ObTIC Co-financé par le projet européen ERC ModERN et l'ObTIC, ce poste a pour objectif de renforcer le déploiement de la politique numérique des deux équipes. Description détaillée de l'offre : https://obtic.sorbonne-universite.fr/actualite/offre-demploi-ingenieur-detude-humanites-numeriques/ Activités principales : - Concevoir et construire la base de données principale du projet ModERN. - Développer et implémenter la politique de traitement et d'exploitation des données contenues dans cette base textuelle pour l'alignement de corpus, la fouille de données et l'analyse de réseaux. Accompagner les projets de recherche soutenus par l'équipe ObTIC, notamment par le développement ponctuel de solutions d'analyse textuelle, de fouille de textes et d'édition. - Accompagner le développement des outils numériques et de la production documentaire : environnement, données, outils et procédures. - Participer à la rédaction des spécifications de projets de fouille et analyse textuelle. - Participer à la vie scientifique des deux équipes : formations, séminaires et ateliers. Compétences recherchées : - Maîtrise d'outils d'analyse de réseaux, de graphes et de représentations visuelles. - Maîtrise d'un langage de script (Python...) et des bases de données. - Bonnes connaissance des outils de TAL, de l'apprentissage automatique et des modèles de langue (BERT, CamemBERT...). - Connaissance des standards patrimoniaux (XML, TEI, IIIF...), des langages d'interrogation et de transformation (Xpath, XSLT...), des métadonnées et des normes d'interopérabilité. - Autres connaissances appréciées : moteurs de recherche (Solr ou ElasticSearch...), édition d'archives numériques (Omeka...). Présentation des deux équipes Le CELLF : Laboratoire de recherche en littérature, philologie et science des textes, allant du XVIe au XXIe siècle et incluant la francophonie, spécialisé notamment dans l'histoire littéraire et l'édition critique (papier et numérique), le Centre d'étude de la langue et des littératures françaises (UMR 8599 CELLF, CNRS - Sorbonne Université) compte 80 chercheurs et enseignants-chercheurs, 6 IT-BIATSS, et 150 à 200 doctorants. Des membres non-statutaires lui sont aussi rattachés en tant que « chercheurs associés ». Hébergé par Sorbonne Université, il est multi-site (rue Victor Cousin, rue Serpente). Le CELLF encourage les projets transdisciplinaires et trans-séculaires. Les humanités numériques sont au coeur de son programme scientifique. L'ObTIC : L'Observatoire des textes, des idées et des corpus (ObTIC) est une équipe-projet de la Faculté des Lettres à Sorbonne Université, dédiée aux humanités numériques et rattachée administrativement au CELLF UMR 8599. Faisant suite à l'ancien LabEx OBVIL, l'ObTIC s'appuie sur une expertise acquise dans la production et l'édition des données, dans la conception et l'expérimentation des logiciels et des algorithmes pour les chercheurs en lettres et sciences humaines et sociales, et dans le développement de nouvelles méthodologies de recherche, fondées sur le numérique, au sein de ces disciplines. Candidature Envoyer un CV et une lettre de motivation aux porteurs du projet avant le 3 juin 2022. - Glenn Roe : glenn.roe@sorbonne-universite.fr - Motasem Alrahabi : motasem.alrahabi@sorbonne-universite.fr