Ingénieur chercheur traitement automatique des langues H/F Domaine Mathématiques, information scientifique, logiciel Contrat CDD Intitulé de l'offre Ingénieur chercheur traitement automatique des langues H/F Statut du poste Cadre Durée du contrat (en mois) 18 Description de l'offre Dans le cadre de projets de recherche structurant du laboratoire, en partenariat avec des partenaires académiques et industriels, vous aurez la mission de mener des recherches et développer des techniques d'extraction d'information étendue, par apprentissage automatique supervisé (Deep Learning). Dans le domaine médical, l'analyse des données textuelles contenus dans les dossiers patients permet de faciliter l'accès à l'information d'intérêt. Ces outils accélèrent les études épidémiologiques, optimise les processus administratifs, facilite le suivi des patients et de manière générale libère du temps de médecin pour le traitement efficace des patients. En général, l'extraction d'information a pour objectif d'identifier des informations structurées dans des contenus textuels. Nous définissons l'extraction d'information étendue comme l'identification d'informations structurées à la fois directement présentes dans le texte (dans une tâche de surlignage, par exemple l'identification d'entités nommées) mais aussi des informations non directement présentes dans le texte (par exemple, associations d'étiquettes thématiques). Plus précisément, l'extraction d'information étendue combine l'extraction d'information classique et la classification automatique de textes : Extraction d'information : identification dans les textes d'informations spécifiques (entités nommées, relations, événements). Cette identification peut combiner des techniques symboliques à base de patrons morpho-syntaxiques et des techniques à base d'apprentissage automatique. Classification automatique : annotation automatique de textes par des étiquettes prédéfinies inférées à partir du contenu du texte. Les techniques utilisées dans ce cadre seront des techniques d'apprentissage automatique statistique (standard ou neuronales). Plus précisément, sous la responsabilité d'un chef de projet, vous serez en charge : - De contribuer à la réflexion scientifique et technique nécessaire à la réalisation du projet; - De réaliser la veille scientifique et technologique ; - De prendre en main et améliorer les outils existants sur ces deux tâches d'extraction d'information et de classification automatique ; - De mettre en place une plateforme combinant ces deux tâches dans un contexte applicatif ; - D'étudier les interactions entre ces deux tâches : comment l'extraction d'information peut aider la classification automatique ou réciproquement. Profil du candidat Profil du candidat - Docteur.e ou ingénieur.e en traitement du langage naturel. - Connaissances en Machine learning, Deep Learning et dans le domaine du traitement automatique des langues: classification de texte, extraction d'information, constitution de ressources, text mining. - Expérience en développement logiciel s'appuyant idéalement sur une maîtrise de Python/ shell /perl, C++ , des connaissances des webservices REST et d'outils de développement et de partage de code tel que Git. - Expérience de l'environnement Linux. - Autonome, rigoureux/rigoureuse et doté.e d'une forte motivation. - Appétence pour le travail collaboratif et en équipe. CDD de 18 mois au CEA de Saclay (91). Salaire selon diplômes et expériences. Les candidat.e.s intéressé.e.s doivent envoyer un email de candidature à bianca.vieru@cea.fr avec un CV détaillé (pdf) et une lettre de motivation. Localisation du poste Site Saclay Localisation du poste France Ville Palaiseau Postuler en ligne : https://www.emploi.cea.fr/offre-de-emploi/emploi-ingenieur-chercheur-traitement-automatique-des-langues-h-f_15504.aspx