Nous recherchons un(e) stagiaire pour travailler sur la problématique
de prédiction des émotions à partir des émojis et son "adaptation" à
des corpus autres que Twitter.

Si votre profil correspond à la description ci-dessous et que vous
êtes intéressé(e), merci d'envoyer votre dossier de candidature à
nicolas.hernandez@univ-nantes.fr.

**Titre** : Prédiction de l'état mental d'un participant d'une
conversation écrite à l'aide d'émojis et d'adaptation au domaine

**Lieu du stage** : Laboratoire des Sciences du Numérique de Nantes
(LS2N) - Équipe Traitement Automatique du Langage Naturel (TALN)

**Durée** : 5 mois - **Début** : Mars 2022

**Salaire** : 600 euros/mois environ

**Profil recherché** :  Niveau bac+5 (Master 2, ingénieur ou équivalent)
-   Des compétences solides en développement logiciel (python)
-   Une formation en Traitement Automatique des Langues, en
    Apprentissage Automatique, en Linguistique computationnelle, ou en
    Sciences des données/Fouille de texte
-   Des qualités d'expression orale et d'écriture (en français et en
    anglais)
-   Des capacités de travail en autonomie comme en équipe, un sens
    de l'organisation et une capacité de restitution
-   Des qualités relationnelles (accompagnement, collaboration)
-   Dynamique et curieux.se

**Candidature** : CV, lettre de motivation, derniers bulletins de notes
à envoyer à nicolas.hernandez@univ-nantes.fr

**Mots clefs** : Traitement Automatique des Langues, Apprentissage
profond, Fouille de texte, Adaptation au domaine, Analyse d'émotions,
Emojis, Twitter

**Description courte** : Comprendre les intentions, désirs, croyances...
d'un intervenant au sein d'une conversation écrite est un problème
difficile en l'absence d'information non verbale comme la modulation de
la voix ou de l'expression du visage.

Les objectifs de ce stage sont
    - 1)    de faire un état des performances et des limites d'un
            système de prédiction d'émotions construits à partir d'un
            corpus contenant des émojis
    - 2)    d'évaluer un tel système après adaptation sur un corpus
            cible non étiqueté de genre et de domaine différent.
    - 3)    compte tenu de l'avancement, l'étude pourra chercher à
            évaluer l'apport de la prise en compte de la structure
            dialogique des contextes d'expression des émotions ainsi
            qu'une configuration d'apprentissage avec de multiples
            tâches voisines (analyse de la polarité d'une opinion, de
            l'intensité d'une émotion, de la subjectivité d'un propos...).

L'étude portera sur des architectures classiques à base d'apprentissage
profond (plongement de mots + Bi-LSTM, modèle de langage à base de
Transformer) décrites dans la littérature. La recherche s'appuiera sur
les données rendues disponibles ces dernières années au travers des
campagnes d'évaluation SemEval.

**Description étendue du sujet** :
https://www.ls2n.fr/stage-these/prediction-de-letat-mental-dun-utilisateur-de-twitter