Offre n°2026-09729

Stage en TAL pour la prédiction des comportements abusifs en ligne

Type de contrat : Stage

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Stagiaire de la recherche

A propos du centre ou de la direction fonctionnelle

Le centre Inria d'Université Côte d'Azur regroupe 42 équipes de
recherche et 9 services d'appui. Le personnel du centre (500 personnes
environ) est composé de scientifiques de différentes nationalités,
d'ingénieurs, de techniciens et d'administratifs. Les équipes sont
principalement implantées sur les campus universitaires de Sophia
Antipolis et Nice ainsi que Montpellier, en lien étroit avec les
laboratoires et les établissements de recherche et d'enseignement
supérieur (Université Côte d'Azur, CNRS, INRAE, INSERM ...), mais
aussi avec les acteurs économiques du territoire.

Présent dans les domaines des neurosciences et biologie
computationnelles, la science des données et la modélisation, le génie
logiciel et la certification, ainsi que la robotique collaborative, le
Centre Inria d'Université Côte d'Azur est un acteur majeur en termes
d'excellence scientifique par les résultats obtenus et les
collaborations tant au niveau européen qu'international.

Contexte et atouts du poste

Les forums de discussion en ligne, tels que Reddit et X (anciennement
Twitter), permettent à des utilisateurs du monde entier de communiquer
entre eux. Cependant, les discussions en ligne sont sujettes à des
échanges toxiques, soit en raison de comportements antisociaux (ASB)
de la part d'utilisateurs malveillants qui cherchent délibérément à
perturber une communication efficace, soit du fait d'utilisateurs
ordinaires qui peuvent se montrer irrités dans des discussions
tendues. L'approche dominante pour atténuer ces comportements repose
sur un paradigme réactif post hoc, dans lequel les systèmes classent
un message comme toxique une fois celui-ci publié.

Toutefois, un corpus de travaux de recherche en pleine expansion
aborde cette problématique selon un paradigme prédictif, à savoir la
prévision du déraillement d'une conversation vers des échanges
toxiques dès les premiers stades de la discussion. Les modèles
relevant de ce paradigme permettent d'envisager des interventions
avant que le préjudice ne se matérialise et peuvent suggérer des
reformulations plus sûres, ou prioriser des contenus à examiner par
les modérateurs et les utilisateurs des forums.

Ce paradigme se heurte néanmoins à plusieurs défis :

    le système doit être capable de prendre en compte non seulement le
    contenu des messages individuels, mais aussi les procédés
    pragmatiques des participants ainsi que la trajectoire
    conversationnelle ;

    la dynamique des conversations évolue en permanence au fil des
    échanges, ce qui nécessite des prédictions dynamiques ;

    la question de savoir comment inciter efficacement les modérateurs
    et les utilisateurs à réagir aux risques de déraillement
    conversationnel demeure encore peu explorée.

Dans ce projet, nous cherchons à répondre à ces trois défis. Un
premier résultat concerne le développement d'un prototype permettant
une prédiction dynamique de bout en bout du déraillement
conversationnel, en combinant des apports linguistiques sur la
dynamique des conversations avec des modèles de langage de grande
taille (LLM). Un deuxième résultat porte sur la mise au point d'un
système pouvant être intégré aux forums de discussion en ligne afin de
rappeler aux utilisateurs les risques de déraillement lorsque la
probabilité prédite dépasse un certain seuil. Enfin, un troisième axe
de recherche propose une taxonomie de stratégies conversationnelles et
de contre-discours susceptibles d'aider les utilisateurs et les
modérateurs à atténuer les tensions potentielles, ces stratégies étant
ancrées dans des théories linguistiques et sociales ainsi que dans les
travaux sur le contre-discours.

Mission confiée

Ce stage vise à appliquer un système prédictif afin d'aider les
utilisateurs ordinaires des forums de discussion en ligne ainsi que
les modérateurs à agir de manière préventive pour éviter l'escalade de
tensions potentielles dans la communication et maintenir des échanges
efficaces. Le ou la candidat·e sera chargé·e de :

    Développer un système d'IA léger, fondé sur les travaux de
    recherche portant sur la modélisation des trajectoires
    conversationnelles pour la prédiction dynamique du déraillement
    des conversations.

    Intégrer ce système dans un forum de discussion en ligne afin
    d'alerter les utilisateurs des risques de déraillement
    conversationnel.

    Mettre en oeuvre une taxonomie de stratégies conversationnelles
    visant à aider les utilisateurs à reformuler leurs messages pour
    réduire les risques de déraillement, et à permettre aux
    modérateurs d'intervenir de manière précoce, avant que des
    dommages ne surviennent.

Principales activités

Ce stage vise à appliquer un système prédictif afin d'aider les
utilisateurs ordinaires des forums de discussion en ligne ainsi que
les modérateurs à agir de manière préventive pour éviter l'escalade de
tensions potentielles dans la communication et maintenir des échanges
efficaces. Le ou la candidat·e sera chargé·e de :

    Développer un système d'IA léger, fondé sur les travaux de
    recherche portant sur la modélisation des trajectoires
    conversationnelles pour la prédiction dynamique du déraillement
    des conversations.

    Intégrer ce système dans un forum de discussion en ligne afin
    d'alerter les utilisateurs des risques de déraillement
    conversationnel.

    Mettre en oeuvre une taxonomie de stratégies conversationnelles
    visant à aider les utilisateurs à reformuler leurs messages pour
    réduire les risques de déraillement, et à permettre aux
    modérateurs d'intervenir de manière précoce, avant que des
    dommages ne surviennent.

Compétences

Des connaissances ou un fort intérêt pour le traitement automatique du
langage naturel (NLP) sont attendus, en particulier pour l'analyse de
conversations en ligne. Une familiarité avec les méthodes
d'apprentissage automatique et les LLMs constituera un atout
important.

Des compétences en programmation Python sont requises, ainsi qu'une
première expérience en analyse de données textuelles, incluant le
prétraitement, la représentation vectorielle des textes et
l'évaluation de modèles. Le ou la candidat·e sera amené·e à exploiter
des jeux de données existants et à implémenter des modèles de
référence (baselines) pour la modélisation des trajectoires
conversationnelles et la détection dynamique du déraillement des
discussions.

Une capacité à contribuer au développement et au test de prototypes
légers, par exemple via une interface simplifiée ou un environnement
de simulation permettant d'intégrer des signaux de risque de
déraillement conversationnel, sera appréciée.

Français et anglais (compréhension écrite indispensable ; capacités
rédactionnelles appréciées).

Avantages

    Restauration subventionnée
    Transports publics remboursés partiellement

    Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps
    plein) + possibilité d'autorisations d'absence exceptionnelle (ex
    : enfants malades, déménagement)

    Possibilité de télétravail (après 6 mois d'ancienneté) et
    aménagement du temps de travail

    Équipements professionnels à disposition (visioconférence, prêts
    de matériels informatiques, etc.)

    Prestations sociales, culturelles et sportives (Association de
    gestion des oeuvres sociales d'Inria)
    
    Accès à la formation professionnelle

    Sécurité sociale
    

Rémunération

Gratification selon temps de présence

Partager

Informations générales

    Thème/Domaine : Représentation et traitement des données et des connaissances
    Calcul Scientifique (BAP E)
    Ville : Sophia Antipolis
    Centre Inria : Centre Inria d'Université Côte d'Azur
    Date de prise de fonction souhaitée : 2026-03-02
    Durée de contrat : 5 mois
    Date limite pour postuler : 2026-02-15

Attention: Les candidatures doivent être déposées en ligne sur le site
Inria. Le traitement des candidatures adressées par d'autres canaux
n'est pas garanti.

Consignes pour postuler

Sécurité défense :

Ce poste est susceptible d'être affecté dans une zone à régime
restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif
à la protection du potentiel scientifique et technique de la nation
(PPST). L'autorisation d'accès à une zone est délivrée par le chef
d'établissement, après avis ministériel favorable, tel que défini dans
l'arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel
défavorable pour un poste affecté dans une ZRR aurait pour conséquence
l'annulation du recrutement.

Politique de recrutement : Dans le cadre de sa politique diversité,
tous les postes Inria sont accessibles aux personnes en situation de
handicap.

Contacts

    Équipe Inria : MARIANNE
    Recruteur :
    Ollagnier AnaÏs / anais.ollagnier@inria.fr

L'essentiel pour réussir

Le stage requiert autonomie, esprit d'analyse et capacité à collaborer
au sein d'une équipe pluridisciplinaire.

Postuler en ligne : https://recrutement.inria.fr/public/classic/fr/offres/2026-09729