*Offre de stage | Sorbonne Université : Analyse de Défigements par des méthodes de TAL* L'équipe de Linguistique Computationnelle du laboratoire STIH propose un stage de Master en TAL/Fouille de Données d'une durée de 3 à 6 mois (selon profil) dans le cadre d'un projet de recherche financé par le GIS « Jeu et Sociétés ». Les missions de ce stage concerneront principalement la détection automatique des séquences défigées dans des écrits courts : microblogs et slogans publicitaires. *Objet * Les défigements sont des procédés créatifs de nature linguistique et sémiotique, qui visent à désolidariser les séquences polylexicales à caractère figé et leurs contextes discursifs. Dès qu'une séquence est défigée, de nouvelles interprétations de la séquence sont possibles, tout en gardant des liens en filigrane avec la séquence initiale. Ce mécanisme de (re)mise en relation est utilisé dans certains types de production langagière tels que slogans publicitaires, écrits humoristiques, calembours etc. *Missions* 1. Construction d'un corpus de slogans publicitaires 2. Modélisation des moules de séquences défigées en discours (typage de construction, dépendance syntaxique, fréquence, etc.) 3. Retrouver leurs origines dans des corpus 4. Proposer des critères d'appréciation et de classification La réalisation concrète attendue : création d'un outil de détection et d'évaluation de la qualité des séquences défigées, notamment celle des slogans publicitaires *Profil et compétences requises* - Connaissances en TAL et/ou en Apprentissage Automatique - Pratique du langage Python - Savoir utiliser des étiqueteurs (POS /tagger/) - Des connaissances en phraséologie seraient un plus *À acquérir* - Prise de connaissances de travaux universitaires contemporains en Sciences du Langage et TAL - Programmation Python - Versionnage avec git *Conditions de recrutement* - Structure de recrutement : Sorbonne Université - Gratification : en vigueur + remboursement de 50 % des frais de transports - Matériel : matériel informatique fourni par l'équipe - Durée du stage : 3 à 6 mois (selon profil), 35h/semaine - Prise de fonction : Possible à partir de mars/avril 2021 - Localisation : Maison de la Recherche, Serpente (Quartier Saint Michel, 75005 Paris) - Stage au sein d'une équipe-projet de 4 personnes *Date limite de candidature : 29 décembre 2020* Candidature : envoyer CV et lettre de motivation à gael.lejeune@sorbonne-universite.fr et lichao.zhu@gmail.com *Références* [1] Blanche GRUNIG (1990), /Les mots de la publicité,/Paris, Collection CNRS Plus, Presses du CNRS, 255 p. [2] François MANIEZ(2000), « Le repérage par traitement automatique du défigement lexical des proverbes dans la presse américaine ». Revue Française De Linguistique Appliquée, 2, 19-32. [3] Salah MEJRI (2013)*,« Figement et défigement : problématique théorique », /Pratiques/, 159-160, 79-97.