Post-doctorat en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F) Date Limite Candidature : lundi 22 juillet 2024 23:59:00 heure de Paris Informations générales Intitulé de l'offre : Post-doctorat en TAL dans le projet ERA-NET CHIST-ERA FAIRClinical (H/F) Référence : UMR9015-NONNAD-002 Nombre de Postes : 1 Lieu de travail : GIF SUR YVETTE Date de publication : lundi 1 juillet 2024 Type de contrat : CDD Scientifique Durée du contrat : 16 mois Date d'embauche prévue : 1 octobre 2024 Quotité de travail : Temps complet Rémunération : Entre 3081,33 et 3519,85 ¤ brut mensuel Niveau d'études souhaité : Niveau 8 - (Doctorat) Expérience souhaitée : 1 à 4 années Section(s) CN : Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues Missions Ce poste postdoctoral est dans le domaine du traitement du langage naturel. La personne recrutée rejoindra le projet international CHIST-ERA FAIRClinical. Elle développera des approches d'apprentissage automatique pour l'extraction d'informations à partir d'articles de recherche médicale et clinique et de leurs documents complémentaires. Activités - Identifier les sources de données nécessaires à l'extraction et à la normalisation des entités. - Développer des pipelines d'extraction d'information à partir des textes complets et des documents complémentaires. - Évaluer les méthodes d'extraction d'information. - Participer aux activités de publication et de communication de l'équipe. Compétences - Doctorat en informatique, en traitement automatique des langues ou similaire. - Compétences en apprentissage automatique supervisé et semi-supervisé, y compris l'apprentissage profond. - Expérience en traitement automatique des langues - Bonne maîtrise de l'anglais, à l'oral comme à l'écrit - Capacité à travailler de manière indépendante et en équipe - Capacité à hiérarchiser les tâches et à prendre des initiatives. Contexte de travail Ce poste fait partie du projet FAIRClinical financé par CHIST-ERA, dont l'objectif est de renforcer le caractère FAIR de tous les fichiers de données complémentaires et d'améliorer de manière significative la réutilisation des formulaires de rapport de cas cliniques non structurés (CRF). Les données complémentaires sont généralement jointes à une publication scientifique, soit directement dans les bibliothèques biomédicales en ligne telles que PubMed Central, soit par l'intermédiaire de plateformes de dépôt généralistes telles que Zenodo. Les CRF recueillent les données des patients dans le cadre d'études et d'essais de recherche clinique, et représentent un sous-ensemble riche en informations de la littérature de recherche clinique et des données complémentaires non structurées des études cliniques. Ce projet propose d'enrichir spécifiquement le contenu de toutes les données supplémentaires - et donc leur interopérabilité, leur trouvabilité et leur réutilisation - en fournissant un contenu plus normalisé. Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR. Postuler en ligne : https://emploi.cnrs.fr/Offres/CDD/UMR9015-NONNAD-002/Default.aspx