Ingénieur chercheur traitement automatique des langues H/F


Domaine

Mathématiques, information  scientifique, logiciel

Contrat

CDD

Intitulé de l'offre

Ingénieur chercheur traitement automatique des langues H/F

Statut du poste

Cadre

Durée du contrat (en mois)

18

Description de l'offre

Dans le cadre de projets de recherche structurant du laboratoire, en
partenariat avec des partenaires académiques et industriels, vous
aurez la mission de mener des recherches et développer des techniques
d'extraction d'information étendue, par apprentissage automatique
supervisé (Deep Learning).

Dans le domaine médical, l'analyse des données textuelles contenus
dans les dossiers patients permet de faciliter l'accès à l'information
d'intérêt. Ces outils accélèrent les études épidémiologiques, optimise
les processus administratifs, facilite le suivi des patients et de
manière générale libère du temps de médecin pour le traitement
efficace des patients.

En général, l'extraction d'information a pour objectif d'identifier
des informations structurées dans des contenus textuels. Nous
définissons l'extraction d'information étendue comme l'identification
d'informations structurées à la fois directement présentes dans le
texte (dans une tâche de surlignage, par exemple l'identification
d'entités nommées) mais aussi des informations non directement
présentes dans le texte (par exemple, associations d'étiquettes
thématiques). Plus précisément, l'extraction d'information étendue
combine l'extraction d'information classique et la classification
automatique de textes :

Extraction d'information : identification dans les textes
d'informations spécifiques (entités nommées, relations,
événements). Cette identification peut combiner des techniques
symboliques à base de patrons morpho-syntaxiques et des techniques à
base d'apprentissage automatique.

Classification automatique : annotation automatique de textes par des
étiquettes prédéfinies inférées à partir du contenu du texte. Les
techniques utilisées dans ce cadre seront des techniques
d'apprentissage automatique statistique (standard ou neuronales).

Plus précisément, sous la responsabilité d'un chef de projet, vous
serez en charge :

- De contribuer à la réflexion scientifique et technique nécessaire à
  la réalisation du projet;

- De réaliser la veille scientifique et technologique ;

- De prendre en main et améliorer les outils existants sur ces deux
  tâches d'extraction d'information et de classification automatique ;

- De mettre en place une plateforme combinant ces deux tâches dans un
  contexte applicatif ;

- D'étudier les interactions entre ces deux tâches : comment
  l'extraction d'information peut aider la classification automatique
  ou réciproquement.

Profil du candidat

Profil du candidat

- Docteur.e ou ingénieur.e en traitement du langage naturel.

- Connaissances en Machine learning, Deep Learning et dans le domaine
  du traitement automatique des langues: classification de texte,
  extraction d'information, constitution de ressources, text mining.

- Expérience en développement logiciel s'appuyant idéalement sur une
  maîtrise de Python/ shell /perl, C++ , des connaissances des
  webservices REST et d'outils de développement et de partage de code
  tel que Git.

- Expérience de l'environnement Linux.

- Autonome, rigoureux/rigoureuse et doté.e d'une forte motivation.

- Appétence pour le travail collaboratif et en équipe.


CDD de 18 mois au CEA de Saclay (91). Salaire selon diplômes et
expériences.  Les candidat.e.s intéressé.e.s doivent envoyer un email
de candidature à bianca.vieru@cea.fr avec un CV détaillé (pdf) et une
lettre de motivation.

Localisation du poste

Site
Saclay

Localisation du poste

France
Ville

Palaiseau

Postuler en ligne :

https://www.emploi.cea.fr/offre-de-emploi/emploi-ingenieur-chercheur-traitement-automatique-des-langues-h-f_15504.aspx