Ingénieur Backend TAL (12 mois) @Centre Inria, Paris 12e, Inria Startup Studio & équipe Almanach Contexte et atouts du poste Le poste d'ingénieur(e) d'une durée de 12 mois est proposé à l'Inria Paris, pour le développement des interfaces d'outils en Traitement Automatique des Langues (TAL) appliqués aux brevets d'invention. Ce projet a pour objectif de développer des outils pour les rédacteurs de demande de brevet (3 millions de demandes par an), notamment: un outil d'édition de revendications de brevet, un outil de génération automatique d'une demande de brevet à partir de ces revendications et un outil de validation d'une demande de brevet, qu'elle soit générée ou pas. Le marché de la Propriété Industrielle est stratégique, le poste ne requiert pas de connaissances préalables dans le domaine, mais une curiosité sincère est recommandée. Vous serez intégré(e) dans l'équipe Inria ALMAnaCH et vous échangerez au quotidien avec une équipe sympathique et surmotivée composée d'un Conseil en Propriété Industrielle et d'un chercheur en I.A. pour le détail des spécifications, et avec un professeur en TAL pour les aspects techniques. Début du contrat idéal : début mars. Possibilité réelle de pérennisation du contrat (Inria, création de Start-up, etc), y compris des parts dans la société à construire. Principales activités Les activités porteront sur : - le développement logiciel (back-end) de la plateforme - l'extraction d'information à partir de très grands corpus ; travail en terminologie; - travail sur des plongements lexicaux (embeddings) spécifiques aux textes techniques : affinement de modèles BERT; - génération de texte, complétion de phrases; - le développement de backend en Django (comptes clients, etc); - gestion de bases de données SQLite; - bonne maîtrise de l'anglais; - aide pour la sécurisation du backend (e.g. double authentication). Compétences - Très bon niveau en Python - Très bonne maîtrise d'un framework ML tel que PyTorch et TensorFlow - Connaissances solides en matière de Traitement du Langage Naturel - Très bonne maîtrise des librairies Python/TAL (Spacy, NLTK, etc.) - Pratique de SQLite ou équivalent L'essentiel pour réussir Les activités porteront sur : - Le développement de mini-projets dans le projet, par exemple travail sur des plongements lexicaux (embeddings) spécifiques aux textes techniques e.g. affinement de modèles BERT, l'extraction d'information à partir de très grands corpus, génération de texte, des auto-complétions de revendications, travail en terminologie, etc. Vous êtes prêts à des itérations rapides, en développement agile. - Le développement logiciel (back-end), en lien avec le front-end de la plateforme d'assistance à la rédaction de demandes de brevet. - Vous pourrez contribuer à la sécurisation de la plateforme côté backend (e.g. double authentication) - La participation aux réunions d'équipes (choix et développement agile de nouvelles fonctionnalités) Postuler en ligne : https://qatent.com/jobs/jobs-2/