========================================================== *NLP&ML pour l'aide à la décision dans un contexte industriel. * ========================================================== _______________________________________________________________ Structure d'accueil : Angers Technopole Durée : 4 à 6 mois à compter de février ou mars 2021 Gratification légale : environ 570¤/mois _______________________________________________________________ *Responsables de stage :* - Naïma El-Kechaï : porteuse du projet de création de startup. - Pierre Chadzynski : chargé de mission à Angers Technopole. Contact : naima.elkechai [ at ] gmail.com _______________________________________________________________ *Mots-clés : NLP, Data analysis, Machine/Deep learning, Text Mining, Python.* *Contexte du stage* Le stage se déroule dans le cadre d'un projet innovant porté par Naïma El-Kechaï et incubé par Angers technopole. Le projet porte sur la conception et le développement d'un outil d'aide à la décision (OAD), destiné au personnel chargé de traiter les non-conformités (NC) en production, dans l'industrie pharmaceutique. Quand une NC est constatée (ex. contamination d'un médicament), elle est déclarée, puis investiguée pour identifier l'origine du problème. L'objectif de l'OAD est d'assister ce personnel pour optimiser le traitement des NC et réduire leur récurrence, en les accompagnant dans leur investigation. L'OAD s'appuie sur deux approches de l'intelligence artificielle (IA) : l'une symbolique et l'autre numérique (big data). Il est donc composé de 2 parties liées : 1. une base de connaissances sémantiques constituée de concepts et de règles métier ; 2. des connaissances déduites des croisements réalisés sur les données industrielles sur les NC. *Objectifs du stage * Le stage concerne l'approche numérique. Il s'agit d'identifier les croisements de données sur les NC déjà résolues de manière à extraire des connaissances qui vont enrichir la partie sémantique existante. Cette extraction va exploiter plusieurs types de données, notamment des données textuelles contenues dans les investigations. Concrètement, il s'agit de poursuivre un travail déjà entamé pour : - Réaliser des classifications supervisées et non-supervisées sur les NC ; - Tester la pertinence d'utiliser les word/text embeddings ; - Identifier des concepts pertinents, des éléments de contexte et des patterns des NC ; - Enrichir la base de connaissances existante avec les éléments identifiés précédemment. *Profil recherché : M2 Informatique/Maths appliquées/5ème année école * Qualités souhaitées : autonomie, curiosité, esprit d'initiative/d'équipe, envie d'apprendre et de travailler sur un projet innovant en early stage, rigueur, sens de l'organisation et sens de l'humour . Compétences/connaissances en : - NLP (Natural Langage Processing) - ML (machine learning) - Frameworks/Méthodes/Outils associés : Scikit-learn ; CNN ; Word embeddings,... - Goût pour la modélisation. - Programmation en Python. - Des connaissances en ingénierie des connaissances seraient appréciées. *Contraintes administratives : Confidentialité* En phase de maturation et dans la perspective d'une création de startup innovante, les travaux effectués durant le stage, les données industrielles et les informations liées au projet restent confidentiels et la propriété intellectuelle appartient contractuellement à 100% à la porteuse du projet. *Poursuite possible en CDI* À la suite du stage, un recrutement pourrait être envisagé. Bien Cordialement, Naïma EL-KECHAÏ