Linguiste informaticien.ne- CDD basé à Paris ou Lyon CDD / Temporaire Début : 1 décembre 2021 Paris Télétravail partiel possible Bac +5 / Master À propos Yseop est un des leaders mondiaux de solutions d'intelligence artificielle dédiées à la NLG (Natural Language Generation). Son logiciel de génération automatique de texte est capable de raisonner et rédiger en plusieurs langues. Yseop transforme les données en textes automatiquement compréhensibles par tous. Avec Yseop, vous révolutionnez l'expérience collaborateur et offrez une expérience client véritablement individualisée. De la souscription au service client, en passant par l'aide au pilotage commercial, Yseop « augmente » la capacité des agents et de chaque salarié en contact avec un client grâce à l'IA. Descriptif du poste La mission porte sur l'analyse de documents pharmaceutiques (Protocol, CSR, Patient Narratives, Lay Summaries, etc.) et plus spécifiquement sur l'identification et la spécification des caractéristiques linguistiques permettant d'identifier et nommer leurs éléments communs. La mission consiste à : - Analyser un corpus d'études pharmaceutiques afin d'identifier, texte a texte, quelles sections des documents sont réutilisés de l'un à l'autre. - Réaliser une taxonomie de ces éléments réutilisables. Cette taxonomie prendra également en compte le workflow de production documentaires. - A partir des éléments textuels identifiés comme réutilisables, réaliser une étude de corpus afin de spécifier linguistiquement comment ces éléments sont transformés d'une étude à l'autre, dans le but d'induire les composants linguistiques qui composent ces transformations. - Enfin, de participer à la réalisation d'un prototype qui mettra en oeuvre ces transformations. - La langue des documents est l'anglais. Cette mission se déroulera au sein de l'entité Yseop Lab, en étroite collaboration avec les équipes travaillant sur l'apprentissage et l'analyse automatique des langues et les experts métiers. La mission s'inscrit dans le contexte de notre produit "Augmented Medical Writer" de génération automatique d'études pharmaceutiques. Profil recherché Vous avez un niveau M2 en TAL, avec de bonnes connaissances en programmation, en particulier en Python avec des outils TAL associés. Des connaissances en bases de données, en modélisation des données et en apprentissage automatique seront appréciées. - Formation M2 en linguistique informatique - Une experience significative sur des sujets similaires - Bon niveau d'anglais - Goût pour l'analyse de corpus - Expérience avec un outil d'extraction d'information (Nooj, Unitex...) - Programmation en Python, la connaissance du développement Java est un plus, ainsi que la connaissance des corpus du domaine médical/pharmaceutique. - Compréhension des approches de machine-learning appliquées au texte - Autonomie et capacité à travailler en équipe Postuler en ligne : https://www.welcometothejungle.com/fr/companies/yseop/jobs/linguiste-informaticien-ne-poste-base-a-paris_paris