*Jeune docteur - DATA ENGINEER confirmé (NLP - Machine/Deep Learning)* *Lieu de travail : Paris (9e entre métro Opéra et métro Saint-Lazare)* *Type de contrat : CDI temps plein* *Salaire : A négocier avec l'entreprise et le candidat* *Contact pour candidater : *contact@phdtalent.org SOFTLAW est une entreprise pionnière de la legaltech qui développe une solution d'analyse automatique de contrats utilisant l'intelligence artificielle pour extraire automatiquement les informations clés des contrats et faciliter leur traitement et leur analyse. SoftLaw (www.softlaw.digital) est à la recherche de nouveaux talents pour participer activement à sa croissance. Si l'environnement start-up te tente, que tu es passionné d'IA et que tu as envie de t'impliquer dans un projet utile et techniquement passionnant, la suite est pour toi ! *MISSIONS :* La donnée contractuelle étant par essence une donnée éminemment confidentielle, la R&D réalisée par SoftLaw a dans un premier temps principalement visé à lui permettre de développer des algorithmes performants d'analyse de textes sous contrainte forte en termes de disponibilité de la donnée à analyser. Avec la disponibilité d'un plus grand volume de données, SoftLaw oriente désormais sa R&D vers l'optimisation de modèles d'analyse de données basées sur de plus gros corpus de textes. En rejoignant l'équipe de SoftLaw, tu seras ainsi amené(e) à travailler sur des méthodes telles que les méthodes de plongement de mots (*word embedding*) et de *reinforcement learning* et à construire des modèles de représentation de documents adapté au domaine juridique. Ton rôle consistera dans: - la réalisation d'un état de l'art sur les différentes techniques de plongement de mots et de *reinforcement learning*, ainsi que sur les extensions proposées pour générer des modèles adaptés à des domaines spécifiques, - la sélection et implémentation des techniques les plus prometteuses, - l'évaluation des différents modèles proposés, - l'industrialisation de ces modèles et l'implémentation de pipelines scalables de traitement de données, - l'intégration des développements dans la plateforme de développent de la Société, et - la mise en place de partenariats avec des laboratoires académiques. *LES COMPÉTENCES :* Langages et technologies : - Python, - Librairies NLP et Machine Learning (par ex. Scikitlearn, NLTK, Spacy, Pytorch, Keras, etc.) - Algorithmes NLP et Machine Learning (embedding,, RNN, LSTM, etc.) Les + : - Expérience de systèmes de gestion de base de donnés type Big data (tels que Spark, mongodb, etc...) - Être familier avec ElasticSearch - Expérience en programmation bas niveau (C/C++, etc.) - Être familier avec les bonnes pratiques de développement, d'intégration et de déploiement continu. *PROFILS RECHERCHÉS :* Tu es rigoureux(se), passionné(e), motivé(e), tourné(e) vers la résolution de problèmes et l'opérationnel. Tu aimes travailler en équipe, contribuer au sein de ton environnement et t'impliquer dans ce que tu entreprends. *Les PLUS DU POSTE** :* Notre projet est techniquement passionnant, nous sommes à un stade très intéressant et stimulant de notre aventure. Notre équipe est pluridisciplinaire, mixte, dynamique et passionnée. Notre cadre de travail est idéal avec des locaux, spacieux et lumineux, idéalement situés entre Opéra et Saint-Lazare. Le télétravail est possible une partie de la semaine. *COMMENT CANDIDATER?* Adresse-nous ton CV à l'adresse mail suivante : contact@phdtalent.org, afin que l'on puisse te recontacter pour un premier échange téléphonique.