**CEA LIST/LVIC, Palaiseau, Île-de-France** ** Poste d'ingénieur logiciel. CDD de 12 mois renouvelable.** **Contexte** Le LIST est un institut de recherche technologique du CEA spécialisé dans la conception et le développement de systèmes complexes ou à forte composante logicielle (http://www-list.cea.fr). Au sein de l'Institut LIST, le Laboratoire de Vision et d'Ingénierie des Contenus (LVIC) emploie une cinquantaine de chercheurs et ingénieurs travaillant sur l'analyse et l'interprétation de données multimédia (texte, image et analyse de vidéos). Dans le domaine de l'Intelligence Artificielle, le laboratoire développe des algorithmes robustes pour l'extraction, l'analyse et le traitement de grands volumes de données multimédia. Nos technologies ont contribué à l'émergence de nouvelles activités économiques par la création de startups telles qu'ANT'Inno. Par ailleurs, le laboratoire participe à de nombreux projets collaboratifs (ANR, Europe, Pôles de Compétitivité) avec des partenaires académiques, PMEs ou grands industriels. Le laboratoire a developpé un analyseur linguistique multilingue nommé LIMA qui a été mis sous licence libre en 2014 (https://github.com/aymara/lima). Pour l'extraction d'entités nommées, LIMA exploite des technologies classiques à base de ressources linguistiques et de règles et des technologies par apprentissage avec des modèles CRF et des modèles à base de réseaux de neurones (bi-LSTM). Or, les ressources linguistiques de l'approche standard manquent d'une mise à jour régulière et les entités extraites par les différentes méthodes ne sont pas corrélées. Dans ce cadre, le laboratoire recherche un collaborateur pour travailler sur ces deux aspects. **Missions** Dans ce cadre, le travail du CDD consistera à : - exploiter des données en ligne comme Wikipédia ou Wikidata pour mettre à jour de façon semi-automatique les ressources pour l'extraction d'entités nommées ; - développer un algorithme de fusion d'entités nommées issues des diverses méthodes. **Profil recherché** Ingénieur en informatique avec une orientation traitement automatique des langues. Le candidat devra posséder une bonne maîtrise du développement en C++ sous GNU/Linux et Microsoft Windows. Une connaissance des framework d'apprentissage profond tels que TensorFlow, Caffé2, etc. serait un plus. Les compétences requises incluent également la maîtrise de Python. Les notions d'intégration continue devront être connues. Une bonne connaissance du traitement automatique des langues (TAL) est indispensable. Qualités professionnelles : ouverture d'esprit et curiosité, esprit d'analyse et de synthèse, capacité à travailler en équipe, forte motivation pour la recherche et l'innovation. Rémunération selon formation et expérience. **Lieu de travail** Centre d'intégration NanoInnov (plateau de Saclay, proche de Polytechnique) **Durée** 12 mois renouvelable **Contact** Les candidatures (CV + lettre de motivation) sont à envoyer à : Romaric Besançon romaric.besancon@cea.fr Gaël de Chalendar gael.de-chalendar@cea.fr