Stage M2 recherche : Etude diachronique des plongements lexicaux contextuels d'entités nommées pour la détection automatique d'événements Entité : Laboratoire LIASD, Université Paris 8 Lieu du stage : IUT de Montreuil 140 rue de la Nouvelle France 93100 Montreuil Encadrant : Aurélien Bossard, maître de conférences Contexte Ce stage prend place dans le cadre d'une collaboration entre le Laboratoire d'Intelligence Artificielle et Sémantique des Données (LIASD) de l'Université Paris 8 et l'Institut National de l'Audiovisuel (INA). Des travaux menés au sein du service de la recherche de l'INA visent à proposer des solutions permettant la recherche et l'identification fine des extraits relatifs à des évènements médiatiques dans de grandes collections d'archives audiovisuelles, ce qui pose la question de l'accès aux données. Ces évènements peuvent aller d'un simple fait faiblement couvert par les médias, à de grands évènements ayant fait l'objet d'une large médiatisation. Ainsi, indexer les contenus audiovisuels par le ou les événements qu'ils traitent est important, et c'est dans ce cadre que prend place le stage que nous proposons. Objectifs du stage Nous souhaitons aborder la détection d'événements concernant les personnalités, plus particulièrement les personnalités politiques. Pour cela, nous voulons exploiter les possibilités offertes par les vecteurs de plongements lexicaux contextuels (contextual word embeddings) des modèles à base de transformeurs et leur évolution dans le temps. Nous faisons l'hypothèse que des ruptures dans la représentation vectorielle d'un mot dans le temps marquent l'apparition d'un événement. La·le stagiaire devra donc déployer des techniques d'apprentissage profond et d'étude de séries temporelles afin de détecter les événements concernant les personnalités. Encadrement Ce stage sera encadré par Aurélien Bossard, maître de conférences au LIASD, et Abdelkrim Beloued, ingénieur de recherche à l'INA. D'autres enseignants chercheurs du LIASD seront susceptibles d'intervenir dans le suivi du stage, notamment lorsque des blocages interviendraient sur leurs thématiques de recherche. Profil recherché - Etudiant·e de M2 / 3e année d'école d'ingénieurs - Connaissances en Traitement Automatique du Langage et apprentissage profond - Maîtrise de pytorch souhaitée Candidature Les candidatures sont à adresser par mail à : - Aurélien Bossard : aurelien.bossard@iut.univ-paris8.fr - Abdelkrim Beloued : abeloued@ina.fr