Offre n°2026-09729 Stage en TAL pour la prédiction des comportements abusifs en ligne Type de contrat : Stage Niveau de diplôme exigé : Bac + 5 ou équivalent Fonction : Stagiaire de la recherche A propos du centre ou de la direction fonctionnelle Le centre Inria d'Université Côte d'Azur regroupe 42 équipes de recherche et 9 services d'appui. Le personnel du centre (500 personnes environ) est composé de scientifiques de différentes nationalités, d'ingénieurs, de techniciens et d'administratifs. Les équipes sont principalement implantées sur les campus universitaires de Sophia Antipolis et Nice ainsi que Montpellier, en lien étroit avec les laboratoires et les établissements de recherche et d'enseignement supérieur (Université Côte d'Azur, CNRS, INRAE, INSERM ...), mais aussi avec les acteurs économiques du territoire. Présent dans les domaines des neurosciences et biologie computationnelles, la science des données et la modélisation, le génie logiciel et la certification, ainsi que la robotique collaborative, le Centre Inria d'Université Côte d'Azur est un acteur majeur en termes d'excellence scientifique par les résultats obtenus et les collaborations tant au niveau européen qu'international. Contexte et atouts du poste Les forums de discussion en ligne, tels que Reddit et X (anciennement Twitter), permettent à des utilisateurs du monde entier de communiquer entre eux. Cependant, les discussions en ligne sont sujettes à des échanges toxiques, soit en raison de comportements antisociaux (ASB) de la part d'utilisateurs malveillants qui cherchent délibérément à perturber une communication efficace, soit du fait d'utilisateurs ordinaires qui peuvent se montrer irrités dans des discussions tendues. L'approche dominante pour atténuer ces comportements repose sur un paradigme réactif post hoc, dans lequel les systèmes classent un message comme toxique une fois celui-ci publié. Toutefois, un corpus de travaux de recherche en pleine expansion aborde cette problématique selon un paradigme prédictif, à savoir la prévision du déraillement d'une conversation vers des échanges toxiques dès les premiers stades de la discussion. Les modèles relevant de ce paradigme permettent d'envisager des interventions avant que le préjudice ne se matérialise et peuvent suggérer des reformulations plus sûres, ou prioriser des contenus à examiner par les modérateurs et les utilisateurs des forums. Ce paradigme se heurte néanmoins à plusieurs défis : le système doit être capable de prendre en compte non seulement le contenu des messages individuels, mais aussi les procédés pragmatiques des participants ainsi que la trajectoire conversationnelle ; la dynamique des conversations évolue en permanence au fil des échanges, ce qui nécessite des prédictions dynamiques ; la question de savoir comment inciter efficacement les modérateurs et les utilisateurs à réagir aux risques de déraillement conversationnel demeure encore peu explorée. Dans ce projet, nous cherchons à répondre à ces trois défis. Un premier résultat concerne le développement d'un prototype permettant une prédiction dynamique de bout en bout du déraillement conversationnel, en combinant des apports linguistiques sur la dynamique des conversations avec des modèles de langage de grande taille (LLM). Un deuxième résultat porte sur la mise au point d'un système pouvant être intégré aux forums de discussion en ligne afin de rappeler aux utilisateurs les risques de déraillement lorsque la probabilité prédite dépasse un certain seuil. Enfin, un troisième axe de recherche propose une taxonomie de stratégies conversationnelles et de contre-discours susceptibles d'aider les utilisateurs et les modérateurs à atténuer les tensions potentielles, ces stratégies étant ancrées dans des théories linguistiques et sociales ainsi que dans les travaux sur le contre-discours. Mission confiée Ce stage vise à appliquer un système prédictif afin d'aider les utilisateurs ordinaires des forums de discussion en ligne ainsi que les modérateurs à agir de manière préventive pour éviter l'escalade de tensions potentielles dans la communication et maintenir des échanges efficaces. Le ou la candidat·e sera chargé·e de : Développer un système d'IA léger, fondé sur les travaux de recherche portant sur la modélisation des trajectoires conversationnelles pour la prédiction dynamique du déraillement des conversations. Intégrer ce système dans un forum de discussion en ligne afin d'alerter les utilisateurs des risques de déraillement conversationnel. Mettre en oeuvre une taxonomie de stratégies conversationnelles visant à aider les utilisateurs à reformuler leurs messages pour réduire les risques de déraillement, et à permettre aux modérateurs d'intervenir de manière précoce, avant que des dommages ne surviennent. Principales activités Ce stage vise à appliquer un système prédictif afin d'aider les utilisateurs ordinaires des forums de discussion en ligne ainsi que les modérateurs à agir de manière préventive pour éviter l'escalade de tensions potentielles dans la communication et maintenir des échanges efficaces. Le ou la candidat·e sera chargé·e de : Développer un système d'IA léger, fondé sur les travaux de recherche portant sur la modélisation des trajectoires conversationnelles pour la prédiction dynamique du déraillement des conversations. Intégrer ce système dans un forum de discussion en ligne afin d'alerter les utilisateurs des risques de déraillement conversationnel. Mettre en oeuvre une taxonomie de stratégies conversationnelles visant à aider les utilisateurs à reformuler leurs messages pour réduire les risques de déraillement, et à permettre aux modérateurs d'intervenir de manière précoce, avant que des dommages ne surviennent. Compétences Des connaissances ou un fort intérêt pour le traitement automatique du langage naturel (NLP) sont attendus, en particulier pour l'analyse de conversations en ligne. Une familiarité avec les méthodes d'apprentissage automatique et les LLMs constituera un atout important. Des compétences en programmation Python sont requises, ainsi qu'une première expérience en analyse de données textuelles, incluant le prétraitement, la représentation vectorielle des textes et l'évaluation de modèles. Le ou la candidat·e sera amené·e à exploiter des jeux de données existants et à implémenter des modèles de référence (baselines) pour la modélisation des trajectoires conversationnelles et la détection dynamique du déraillement des discussions. Une capacité à contribuer au développement et au test de prototypes légers, par exemple via une interface simplifiée ou un environnement de simulation permettant d'intégrer des signaux de risque de déraillement conversationnel, sera appréciée. Français et anglais (compréhension écrite indispensable ; capacités rédactionnelles appréciées). Avantages Restauration subventionnée Transports publics remboursés partiellement Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement) Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.) Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria) Accès à la formation professionnelle Sécurité sociale Rémunération Gratification selon temps de présence Partager Informations générales Thème/Domaine : Représentation et traitement des données et des connaissances Calcul Scientifique (BAP E) Ville : Sophia Antipolis Centre Inria : Centre Inria d'Université Côte d'Azur Date de prise de fonction souhaitée : 2026-03-02 Durée de contrat : 5 mois Date limite pour postuler : 2026-02-15 Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti. Consignes pour postuler Sécurité défense : Ce poste est susceptible d'être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L'autorisation d'accès à une zone est délivrée par le chef d'établissement, après avis ministériel favorable, tel que défini dans l'arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l'annulation du recrutement. Politique de recrutement : Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap. Contacts Équipe Inria : MARIANNE Recruteur : Ollagnier AnaÏs / anais.ollagnier@inria.fr L'essentiel pour réussir Le stage requiert autonomie, esprit d'analyse et capacité à collaborer au sein d'une équipe pluridisciplinaire. Postuler en ligne : https://recrutement.inria.fr/public/classic/fr/offres/2026-09729