*** Génération automatique de poésie inspirée de poèmes existants *** Collaboration entre les laboratoires LATTICE (Paris, Montrouge) et IRIT (Toulouse) Lieu du stage : laboratoire LATTICE, Montrouge Encadrants : Thierry Poibeau, Clément Plancq (LATTICE) ; Tim Van de Cruys (IRIT) * Motivation et descriptif La génération automatique de poésie est une tâche ardue pour un système informatique. Pour qu'un poème ait du sens, il est important de prendre en compte à la fois des aspects linguistiques et littéraires. Tout d'abord, un système de génération de poésie doit modéliser de manière correcte la syntaxe, et la cohérence sémantique et discursive. De plus, le système doit intégrer diverses contraintes (telles que la forme et la rime) liées à un genre poétique particulier. Enfin, le système doit faire preuve d'une certaine créativité littéraire, ce qui rend le poème intéressant et digne d'être lu. Ce stage s'inscrit dans le contexte du projet Oucopo [1], qui vise à explorer les liens entre textes et numérique avec, au-delà des aspects purement techniques et scientifiques, la prise en compte d'aspects esthétiques. Le projet s'inspire en premier lieu de l'ouvrage de Raymond Queneau "Cent mille milliards de poèmes", paru en 1961, qui permet de combiner des vers pour composer des poèmes respectant la forme du sonnet. Dans ce contexte, ce stage vise à étendre l'idée de recombinaison, en explorant l'interaction entre des poèmes écrits par des humains, et les poèmes générés de manière automatique. Plus spécifiquement, on utilisera des poèmes existants comme source d'inspiration pour un système de génération de poésie automatique. A partir d'un poème existant, un système de génération pourrait par exemple : - induire une représentation à base d'une partie des vers d'un poème existant, et générer des vers pour compléter le poème ; la génération des vers est censée suivre les contraintes du poème existant (notamment par rapport au rythme et à la rime) ; - générer un nouveau poème similaire au poème existant, mais en changeant le schéma de rime ; - générer un nouveau poème à base des thèmes évoqués dans le poème existant. Cette liste n'est pas exhaustive; il existe évidemment de nombreuses manières de générer des poèmes sur la base de ceux existants. De manière pratique, ce stage s'appuiera sur une système de génération de poésie existant, appelé Charles, et développé à l'IRIT à Toulouse [2,3]. Ce système de génération utilise un modèle de réseaux de neurones récurrents dans une configuration encodeur-décodeur. L'encodeur construit d'abord une représentation d'une phrase entière en incorporant séquentiellement les mots de cette phrase dans un vecteur d'état caché de taille fixe. La représentation finale est ensuite donnée au décodeur, qui émet une séquence de mots selon une distribution de probabilité dérivée de l'état caché de la phrase en entrée. En apprenant au réseau à prédire la phrase suivante avec la phrase actuelle en entrée, le réseau apprend à générer du texte brut avec une certain cohérence discursive. En transformant la distribution de probabilité fournie par le décodeur, afin d'incorporer des contraintes poétiques, le réseau peut être exploité pour la génération de vers poétiques. Pendant ce stage, le système de génération serait adapté et étendu afin de mettre en oeuvre les objectifs décrits ci-dessus. * Public visé Ce stage s'adresse à un(e) étudiant(e) de niveau M2 ou 3ème année d'école d'ingénieurs, ayant de bonnes connaissances de programmation en Python. La connaissance de bibliothèques pour l'implémentation de réseaux de neurones (et plus spécifiquement Pytorch) est un atout. * Conditions du stage Stage de 4 à 6 mois, à partir du printemps 2020 indemnisé suivant les conditions en vigueur Convention de stage obligatoire * Comment candidater ? Envoyer un mail avec quelques mots sur votre intérêt pour ce stage dans le corps du mail, et en pièces attachées un CV et un relevé de notes récent. Adresser le mail à Thierry Poibeau (thierry.poibeau@ens.fr) * Références [1] http://www.transfers.ens.fr/l-oupoco-l-ouvroir-de-poesie-combinatoire [2] https://github.com/timvdc/poetry [3] Tim Van de Cruys. La génération automatique de poésie en français. Proceedings of TALN 2019, pages 113-126, Toulouse, France.