Stage de fin d'études Ecole d'Ingénieurs / Master 2 au GRICAD, Grenoble Lieu du stage (en présentiel) : GRICAD (Grenoble Alpes Research. Infrastruture de CAlcul intensif et de Données). 700 Avenue Centrale, 38400, Saint-Martin-d'Hères, France *Titre du stage* : Simulation d'un patient sous anesthésie générale grâce aux outils de l'Intelligence Artificielle. Méthodes basées sur le Traitement Automatique du Langage* *Contexte* Ce stage s'inscrit dans le cadre du projet MORPHEE, en cours de réalisation grâce à une collaboration entre le GRICAD (Grenoble Alpes Recherche - Infrastructure de Calcul Intensif et de Données) et le LS2N (Laboratoire des Sciences du Numérique de Nantes). Cette collaboration a été initiée en avril 2022, puis développée, dans le contexte du PNRIA (Plan National de la Recherche en Intelligence Artificielle). Cette collaboration a pour objectifs de proposer et développer une ou des solutions numériques pour la simulation de l'évolution des signaux physiologiques d'un patient sous anesthésie, sous l'effet des actes de l'équipe médicale. *Problématique générale* Environ 7 millions de chirurgies sous anesthésie générale sont réalisées chaque année en France. Afin d'améliorer la sécurité et la qualité des soins peropératoires, le territoire national est maillé de plateformes de simulation, qui comptent l'anesthésie parmi les spécialités offertes en formation initiale ou continue. Dans cette spécialité, ces plateformes proposent des scénarios d'entraînement sur mannequin réaliste, auxquels sont confrontés les futurs professionnels en apprentissage ou les praticiens plus expérimentés. La personne en apprentissage est immergée dans une équipe médicale, qui joue un jeu de rôles. En fonction des actions médicales réalisées par l'équipe médicale (personne en apprentissage comprise), un formateur règle l'évolution des signaux physiologiques (par exemple la fréquence cardiaque) du mannequin. Ce sont les connaissances expertes du formateur qui permettent de simuler l'évolution du patient. Or, les CHU et établissements de soins ont obligation légale d'enregistrer l'évolution des signaux physiologiques des patients pour toutes les chirurgies pratiquées. En parallèle, l'équipe médicale mémorise numériquement la trace des actions médicales réalisées durant toute chirurgie. A terme, il est proposé une modalité de simulation assistée par le numérique, guidée par un modèle entraîné sur des données enregistrées lors de chirurgies. Dans cette modalité, à chaque fois qu'une action médicale est réalisée, il s'agit de prédire l'évolution des signaux physiologiques du patient numérique simulé, en fonction de l'historique des actions déjà réalisées, jusqu'à la prochaine action de l'équipe médicale. Par ailleurs, dans cette modalité, un seul être humain est présent, à savoir la personne en formation. Les autres agents de l'équipe médicale sont virtuels. Il y a donc nécessité de prédire la prochaine action plausible qui sera réalisée par un agent de l'équipe médicale autre que la personne en formation. De cette nouvelle modalité est attendu l'accès potentiel à une grande variété de scénarios, par rapport à la simulation avec un mannequin. De plus, un plus grand réalisme des scénarios est attendu, grâce à l'utilisation d'un modèle appris sur des données de patients. *Méthode* Grâce à l'expertise en anesthésie du partenaire CHU de Nantes / LE SiMU(1) du LS2N à Nantes, le LS2N a développé un générateur de données réalistes (BDLBS). Ce générateur permet de fournir des traces d'événements médicaux inhérents à une procédure d'anesthésie générale, et des mesures de signaux physiologiques cohérentes avec ces traces, pour une cohorte de patients. Cette cohorte peut être élargie à tout moment grâce au générateur. C'est ainsi qu'il a été possible d'obtenir un ensemble de données mixtes, décrivant 1000 patients, composées de variables continues (i.e., les signaux physiologiques) et discrètes (données catégorielles correspondant aux événements médicaux). Deux communautés disjointes travaillent sur la modélisation de traces d'événements [Z22] et la modélisation de séries temporelles [MJK16, THS21], respectivement. La modélisation conjointe de séries temporelles et de traces d'événements, ce qui nous intéresse dans ce stage dans un objectif de double prédiction, a donné lié à de très nombreux travaux [ASG20]. Cependant, ces travaux se restreignent à une unique classe d'événements, à unique occurrence (récidive de maladie, durée de survie). Pour résoudre notre problème de double prédiction (série temporelle, prochain événement), nous avons considéré le cadre de travail offert par les réseaux de neurones artificiels. Nous avons développé un premier modèle permettant de prédire à tout instant les prochains signaux physiologiques ainsi que le prochain événement médical. Contrairement à ce qui est usuel, nous avons conçu un modèle de langage qui opère selon les principes du TALN (Traitement Automatique du Langage Naturel). En effet, la motivation à l'origine de ce nouveau modèle vient du fait que les approches basées sur les méthodes classiques développées pour la prédiction de séries temporelles numériques, restent largement insatisfaisantes en termes de prédiction de données mixtes. En effet, ces approches peinent à prédire des variables catégorielles nominales (i.e., non-ordonnées). Ainsi, nos travaux ont montré que considérer ce jeu de données mixtes en adaptant un modèle habituellement réservé à une approche TALN est une manière efficace et adaptée pour résoudre le double problème de prédiction (de série temporelle, et du prochain événement). Les premiers résultats dépassent considérablement les performances obtenues au moyen des méthodes de l'état-de-l'art ; ils sont en phase de valorisation pour des publications à venir. (1) Laboratoire Expérimental de Simulation en Médecine Intensive de Nantes Université *Objectifs du stage* Développer une version 2 du modèle déjà en place. Il s'agira d'un modèle basé sur le Transformer [VSP17]. Éditer les résultats (figures et statistiques) pour une soumission d'article scientifique dans un journal à thématique IA (Intelligence Artificielle). *Profil recherché* - Cinquième année d'Ecole d'Ingénieurs / M2 en mathématiques appliquées, ingénierie, ou informatique (si possible à spécialité intelligence artificielle). - Goût pour la recherche et le développement. Possibilité de poursuivre en thèse sous condition de financement. - Capacité à programmer en Python absolument nécessaire, capacité à utiliser des librairies de Machine Learning fortement souhaitée (Pytorch, Tensorflow). - Rigueur dans la programmation - Capacité à documenter du code - Aptitude au travail en équipe et capacité à rendre compte de l'avancée de ses travaux - Capacité de rédaction en anglais souhaitée : notamment, si elle est motivée, la personne en stage contribuera à la préparation d'un article scientifique à soumettre dans un journal de rang A à thématique IA *Gratification* Rémunération conforme au seuil légal, environ 600 euros/mois. *Conditions de stage* Stage en présentiel de 6 mois, de début Février 2024 à fin Juillet 2024. Locaux de GRICAD, 700 Avenue Centrale, 38400, Saint-Martin-d'Hères. *Encadrement* Fadoua TAIA-ALAOUI (50%), PhD, Ingénieur de Recherche CNRS à GRICAD, Grenoble, fadoua.taia-alaoui@univ-grenoble-alpes.fr Christine SINOQUET (50%), PhD, Maître de Conférences HdR au LS2N, Nantes, christine.sinoquet@univ-nantes.fr *Planning prévisionnel* *FÉVRIER* *S1* Mise en place de l'environnement de travail (PC, cluster, git) + Familiarisation avec la problématique *FÉVRIER S2-S3 *Prise en main et étude du modèle déjà implémenté pour le comprendre et comprendre le besoin d'utiliser un Transformer *FÉVRIER S4* Recherche d'une base de Transformer disponible publiquement sur Internet à adapter au problème traité *MARS S1-S4 *Implémentation de la V0 sur le dataset BDLBS *AVRIL S1-S2 *Evaluation de la V0 *AVRIL S2* Etablissement de 1 ou 2 pistes d'amélioration *AVRIL / MAI S3-S4-S1 *Implémentation de la V1 *MAI S2* Evaluation de la V1 *MAI S3-S4* Calcul des statistiques finales et figures de résultats -> Export et sauvegarde des résultats pour publication *JUIN (Rédaction du mémoire de stage) S1* Chapitre Introduction et Etat de l'art *JUIN (Rédaction du mémoire de stage) S2 *Chapitre Méthodes *JUIN (Rédaction du mémoire de stage) S3 *Chapitre Résultats et Analyse *JUIN (Rédaction du mémoire de stage) S4 *Conclusion + Contribution à l'élaboration d'un plan pour une version initiale d'article scientifique, si la personne en stage souhaite être impliquée dans la préparation de l'article à soumettre. *JUILLET S1 *Restitution de code pour de futures utilisations *JUILLET S2* Correction du mémoire après retours des encadrants *JUILLET S3 *Test soutenance 1 et améliorations *JUILLET S4 *Test soutenance 2 - Début de rédaction de l'article scientifique, si la personne en stage souhaite être impliquée *Comment candidater* Date limite de candidature : 15 janvier 2024 dossier de candidature (*archive .zip* uniquement) à transmettre à fadoua.taia-alaoui@univ-grenoble-alpes.fr et christine.sinoquet@univ-nantes.fr. Le dossier de candidature comportera obligatoirement : - un curriculum vitae, - une lettre de motivation, - les relevés de notes des années 2021-22 et 2022-23, - les noms, qualités, adresses électroniques et télephones de deux personnes référentes. Une audition et/ou un test technique pourront être proposés. Les personnes candidates sont invitées à transmettre des liens vers une sélection de leurs dépôts git. *Références bibliographiques* [ASG20] M. Alsefri, M. Sudell, M. García-Fiñana and R. Kolamunnage-Dona (2020) Bayesian joint modelling of longitudinal and time to event data: a methodological review. BMC Medical Research Methodology 20, 94. [MJK16] D.C. Montgomery, C.L. Jennings, and M. Kulahci (2016) Introduction to time series analysis and forecasting. Wiley Series in Probability and Statistics. Wiley, 2nd edition. [THS21] J. F. Torres, D. Hadjout, A. Sebaa, F. Martínez-Álvarez and A. Troncoso:(2021) Deep learning for time series forecasting: a Survey. Big Data 9(1): 3-21. [VSP17] A.Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A.N. Gomez, L. Kaiser and I. Polosukhin (2017) Attention is all you need. Conference on Neural Information Processing Systems (Neurips), pp. 5998-6008.