Offre d'emploi : Ingénieur(e) de recherche (H/F) en TAL / LLMs, / Machine learning Présentation de E-cole E-cole est une jeune entreprise innovante (JEI) établie sur l'île de la Réunion. Depuis plus de deux ans, nous sommes engagés dans le développement d'une plateforme pédagogique intelligente spécialisée dans les domaines de la comptabilité et de la gestion. Notre plateforme génère des exercices interactifs et offre aux utilisateurs un feedback automatique précis, comprenant des corrections personnalisées et des solutions détaillées (voir www.e-cole.io). Notre équipe passionnée et multidisciplinaire réunit des experts en pédagogie, développement technologique, intelligence artificielle et sciences sociales. Ensemble, nous nous engageons activement dans la transformation de l'éducation par l'intégration de technologies de pointe. Notre vision est de créer un environnement d'apprentissage adaptatif et personnalisé, répondant aux besoins uniques de chaque apprenant. Nous souhaitons développer un usage intelligent et responsable de l'IA générative. Plutôt que de générer tout le contenu de notre plateforme, nous cherchons à enrichir un contenu pédagogique déjà soigneusement construit et à assister les étudiants dans leur parcours et leur démarche de compréhension. Notre objectif est de tirer parti des technologies avancées pour améliorer l'apprentissage tout en respectant des principes éthiques rigoureux. Si vous partagez notre passion pour l'innovation éducative et souhaitez contribuer à un projet qui fait réellement la différence, nous serions ravis de vous rencontrer et d'explorer comment vous pouvez apporter votre expertise à notre mission. Profil Recherché Nous recherchons un(e) jeune docteur(e), sans expérience préalable en CDI, spécialisé(e) dans le traitement automatique des langues et l'intelligence artificielle. Le(la) candidat(e) idéal(e) devra posséder les compétences suivantes : - Solides connaissances en modèles de langage et systèmes IA. - Expérience en ingénierie logicielle et programmation, notamment en Python. - Autonome, passionné(e), proactif(ve) et polyvalent(e). Missions - Assurer une veille technologique continue sur les outils d'IA générative et explorer les potentialités d'application pour E-cole (e.g., veille sur les derniers LLMs Open Source et leurs évaluations). - Proposer et discuter des applications de ces outils avec les équipes métiers, et élaborer des plans de développement détaillés. - Concevoir, développer et optimiser des applications d'IA générative pour améliorer les fonctionnalités de la plateforme E-cole. - Participer activement à l'intégration des solutions développées sur la plateforme en collaboration avec le reste de l'équipe de développement d'E-cole. Conditions du contrat Nous proposons un Contrat à Durée Indéterminée (CDI) avec les conditions suivantes : - Rémunération : 45 000¤ brut annuel. - Télétravail : Travail majoritairement à distance et avec une grande flexibilité. - Localisation : Île de la Réunion Projets de recherche 1. Système RAG Avancé Le projet de recherche vise à développer un service Retrieval Augmented Génération (RAG) pour améliorer l'accès et l'interaction avec les documents académiques. Le candidat devra concevoir une solution permettant aux utilisateurs d'accéder rapidement à des informations précises, de générer des résumés pertinents et de faciliter une interaction contextuelle enrichie avec les documents. Les principales composantes incluent l'intégration d'une base de données documentaire avec des mises à jour continues, la mise en place d'un système de filtrage pour affiner les recherches, l'utilisation de modèles de langage avancés pour le module de génération de contenu, et le développement d'une interface utilisateur intuitive pour des interactions efficaces et conviviales. 2. Fine-Tuning d'un Large Language Model (LLM) Le projet de recherche envisagé consiste à réaliser le Fine-Tuning d'un Large Language Model (LLM) tel que Phi-2, Mistral ou Llama-3. L'objectif principal est de développer un assistant intelligent spécialisé dans l'accompagnement pédagogique en comptabilité gestion, en tenant compte des aspects psychologiques des apprenants. Ce modèle innovant vise à simplifier la compréhension des concepts complexes pour les étudiants en générant des définitions précises et en offrant un soutien pédagogique personnalisé. Le projet se déroulera en plusieurs phases : l'extraction de données robustes comme des manuels, publications scientifiques et rapports pertinents, suivie d'un traitement avancé et d'une normalisation pour garantir leur pertinence. Technologies utilisées Dans le cadre de ce poste, les technologies suivantes seront utilisées : - Parameter-Efficient Fine-Tuning (PEFT) et QLoRA : techniques avancées pour le fine-tuning efficace des modèles de langage quantifiés. - Construction et Traitement de Corpus : méthodes pour la création et le traitement de corpus de données textuelles. - Maîtrise de PyTorch ou TensorFlow : utilisation des frameworks de deep learning pour le développement et l'optimisation des modèles IA. - Accès et Utilisation des API : intégration avec les API telles que Mistral, Groq et OpenAI. - Connaissance de LangChain : compréhension des applications de LangChain pour les projets IA (un plus). Postuler à l'offre : Veuillez nous contacter en envoyant votre CV et LM à l'adresse suivante : contact@e-cole.io