Ingénieur(e) de recherche NLP (CDI) Présentation Emvista Emvista transforme l'e-mail en un outil de productivité grâce à Prevyo, un assistant virtuel intelligent. Prevyo est capable de rediriger vos e-mails, de détecter ceux qui sont vraiment urgents, de classer les pièces jointes, d'enrichir votre carnet d'adresses. Emvista, entreprise située à Montpellier, est l'éditeur de Prevyo. Prevyo repose sur une intelligence artificielle hybride qui combine les deux approches machine learning/deep learning et connaissances linguistiques et ontologiques. Cette IA analyse sémantiquement les e-mails en s'appuyant sur de nombreuses briques technologiques telles que la reconnaissance d'expressions temporelles, la reconnaissance d'entités nommées ou encore l'extraction d'événements. Ces informations sont représentées sous forme ontologique à partir de laquelle un raisonnement automatique est en mesure de faire apparaître des connaissances qui n'apparaissaient pas au premier abord. Présentation du poste Rattaché(e) directement au directeur de recherche pour renforcer l'équipe de R&D spécialisé dans les technologies du Traitement Automatique du Langage Naturel et de la Représentation des Connaissances, nous sommes à la recherche d'un(e) ingénieur(e) de recherche dans ces domaines. Vous serez aussi en relation avec l'équipe de développement. - CDI - Télétravail partiel possible - Montpellier Missions La mission principale pour le ou la candidate est la prise en charge des travaux impliquant des techniques et modèles d'apprentissage (machine learning/deep learning) au sein des projets de Emvista. Dans ce cadre, les missions sont les suivantes : - Contribution à la recherche et au développement des briques technologiques déjà existantes chez Emvista (parsing, normalisation, reconnaissance d'entités nommées, analyse d'opinions/émotions, résumé automatique, extraction de mots clés, génération de concepts, agent conversationnel, etc.) - Veille et état de l'art dans le domaine du NLP - Evaluation des solutions NLP (académiques et industrielles) - Encadrements d'étudiants (stagiaires, doctorants, etc.) - Publications scientifiques (articles dans des conférences et journaux nationaux et internationaux, participation à des workshops, etc.) - Vulgarisation de la recherche (articles journalistiques, réseaux sociaux, etc.) En particulier, Emvista est coordinatrice d'un projet de recherche collaboratif intitulé POPCORN "Peuplement OPérationnel de bases de COnnaissances et Réseaux Neuronaux". Ce projet subventionné par l'Agence de l'Innovation et de Défense (AID) implique trois partenaires : Emvista, Airbus Defense and Space et le Laboratoire d'Informatique de Grenoble (équipe GETALP). Le projet POPCORN aborde le problème de l'enrichissement semi-automatisé d'une base de connaissance via l'analyse automatique de textes. Le projet se focalise sur les trois axes de recherches suivants: - Génération de données synthétiques textuelles à partir de textes de référence ; - La reconnaissance des entités d'intérêt, des attributs associés et des relations entre les entités. - La désambiguisation sémantique des entités (en cas d'homonymie par exemple) POPCORN mobilisera plusieurs personnes de l'équipe R&D de Emvista dont vous qui aurez pour mission de prendre en charge les travaux impliquant du machine learning/deep learning appliqué au texte en collaboration avec les partenaires. La personne retenue sera pleinement investie dans POPCORN durant les 3 premières années qui correspondent à la durée du projet, à compter du 3 janvier 2022. Les résultats issus des recherches menées sur le projet POPCORN seront intégrés dans les solutions commercialisées de Emvista, dont Prevyo. Il s'agira notamment de structurer l'information contenue dans les e-mails (noms de projets, activités, clients, ...) en vue de peupler une base d'un outil de management de relations clients (CRM). Profil & Attitude - Très bonne connaissance des algorithmes de machine learning pour le traitement automatique du langage naturel - Maîtrise des modèles de langue récents, en particulier pour le français (BERT, FlauBERT, CamemBERT, ...) - Doctorat ou diplôme d'ingénieur avec spécialisation dans le Traitement Automatique du Langage Naturel - Maîtrise des techniques et méthodologies de recherche - Connaissance des nouvelles technologies NLP, des approches statistiques applicables au NLP - Très bonne expression écrite en français (idéalement en anglais également) - Être pédagogue - De bonnes connaissances en Java, maîtrise de Python ainsi que des frameworks ML/DL (PyTorch, TensorFlow, Scikit-Learn ...) Informations complémentaires Unité d'accueil : Emvista (groupe India Juliet) Lieu : Cap Oméga, Rpt Benjamin Franklin, CS 39521, Montpellier, France Merci d'envoyer votre candidature à cedric.lopez@emvista.com constitué du CV et d'une lettre de motivation.