Offre de stage Master Recherche en EIAH et TALN/Fouille de texte =============================== Titre : Explorer le contenu textuel des forums des MOOCs pour analyser le niveau d'engagement des apprenants Mots-clés : IA, TALN, EIAH, MOOC, e-Learning, modèle de l'apprenant Durée : 6 mois Gratification : environ 580 ¤/mois Lieu : selon la situation sanitaire, télétravail ou un des locaux suivants : * IMT Atlantique, Laboratoire Lab-STICC, Technopôle Brest-Iroise CS 29238 Brest. France * LS2N (UMR 6004) 2, Rue de la Houssinière F-44322 Nantes Cedex 3 - FRANCE Perspective : la présente offre intervient en contexte de montage de projets avec financement de thèse ; un financement effectif devra être confirmé. Contexte et sujet du stage -------------------------- L'engouement pour l'apprentissage en ligne à des fins de formation continue, notamment via les MOOCs (Massive Online Open course), n'est plus à prouver[1], et cela indépendamment de situations sociales critiques inédites (enseignement d'une langue à des milliers de réfugiés, continuité pédagogique de millions d'enfants et d'étudiants en période de confinement mondial) qui soulignent la nécessité d'avoir la capacité d'enseigner (et d'apprendre) à distance[2]. Pour l'UNESCO[3], il est nécessaire de réviser nos stratégies pour être en mesure de suivre les processus d'apprentissage à distance des apprenants, de veiller à leur niveau d'engagement et d'évaluer leurs résultats d'apprentissage. Dans le cadre d'un amorçage de collaboration scientifique, l'équipe MOTEL (MOdels and Tools for Enhanced Learning) du laboratoire Lab-STICC et l'équipe TALN (Traitement Automatique du Langage Naturel) du laboratoire LS2N s'associent pour proposer un stage de recherche en traitement automatique des langues (TAL) appliqué à l'apprentissage humain et indirectement au développement d'Environnements informatiques pour l'apprentissage humain (EIAH). Objectifs du stage ------------------ Ce stage vise à mener une étude linguistique qualitative et quantitative des messages entre les différents acteurs (apprenants, tuteurs, enseignants) d'un forum de discussion d'un MOOC afin de 1) mieux comprendre la nature des participations et des échanges, et par là, 2) exprimer des indices langagiers pouvant soutenir la construction d'indicateurs nécessaires à l'estimation du niveau d'engagement des apprenants dans leur formation. Les fonctions méta-discursives (e.g. salutation, demande d'assistance, acquittement, ...) sont un des indices envisagés pour décrire les différentes formes de participation. Une des activités consistera à adapter une taxonomie de fonctions existante aux données manipulées. La dimension émotionnelle pourra être considérée. Ce travail s'accompagnera d'une activité d'annotation manuelle, d'abord à des fins d'exploration puis éventuellement d'entraînement ou d'évaluation d'un système de reconnaissance automatique. Le travail d'exploration doit donner lieu à la définition d'indices, ainsi qu'à l'implémentation de méthodes permettant leur extraction (prédiction, reconnaissance...). Diverses approches peuvent être envisagées, de l'usage de règles à l'apprentissage profond en passant par l'apprentissage statistique. La langue d'étude sera le français. Des perspectives possibles à ce stage concernent la construction d'indicateurs d'engagements à partir de ces indices langagiers, l'alimentation d'un modèle d'apprenant à l'aide de ces indicateurs, la classification des apprenants selon leur niveau d'engagement, l'alimentation de tableaux de bord destinés aux différents acteurs pédagogiques ou encore la personnalisation de l'interaction avec un chatbot. Missions -------- * Réaliser un état des lieux des recherches scientifiques en analyse linguistique des messages échangés sur des forums ; * Mener une étude quantitative/qualitative de forums de plateformes d'apprentissage en ligne ; * Proposer une taxonomie de fonctions méta-discursives existantes aux données et réaliser un travail d'annotation à des fins d'exploration, d'évaluation ou d'entraînement ; * Déterminer des indices linguistiques soutenant le calcul du niveau d'engagement des apprenants ; * Proposer et implémenter des méthodes automatiques pour l'extraction de ces indices à l'aide d'apprentissage et/ou de règles ; * Valider la performance de ces systèmes sur un corpus de test ; * Produire, synthétiser et restituer les résultats dans un rapport et/ou une publication de niveau scientifique. Bibliographie ------------- * Ghada AlHarbi, Thomas Hain, The OpenCourseWare Metadiscourse (OCWMD) Corpus. LREC, 2016 * Chang-Qin Huang, Zhong-Mei Han, Ming-Xi Li, Morris Siu-yung Jong, Chin-Chung Tsai, Investigating students' interaction patterns and dynamic learning sentiments in online discussions, Computers & Education 140, 2019 * Kiruthika Ragupathi, Muthu Kumar Chandrasekaran, Min-Yen, Kan, Bernard C Y Tan, Investigating student learning in online discussion forums through a transactivity framework, ISSoTL, Calgary, October 11-14, 2017 * Denyze Toffoli, De la théorie à la pratique : appliquer des modèles cognitifs de la motivation dans un centre de langues, ASp, 41-42, 2003 * Miaomiao Wen, Investigating Virtual Teams in Massive Open Online Courses: Deliberation-based Virtual Team Formation, Discussion Mining and Support, PhD thesis, Carnegie Mellon University, August 16, 2016 Profil recherché ---------------- Candidat.e de niveau Master Recherche : * Des compétences solides en programmation/algorithmique (python) * Des notions en TAL, Fouille de texte, Linguistique computationnelle, Apprentissage Automatique ou en EIAH * Des qualités d'écriture et d'organisation. La connaissance du français est nécessaire. La pratique de l'anglais écrit est fortement souhaitée. * Des qualités relationnelles (accompagnement, collaboration) * Un dynamisme, curiosité, sens de l'organisation et du travail en équipe, autonomie et capacité de restitution. Candidature ----------- CV et lettre de motivation à envoyer à nicolas.hernandez à univ-nantes.fr et issam.rebai à imt-atlantique.fr ________________ [1] https://www.classcentral.com/moocs-year-in-review-2019 [2] https://www.ifs.org.uk/publications/15038 [3] https://unesdoc.unesco.org/ark:/48223/pf0000373305.locale=en