Titre : Génération automatique de titres de section dans des textes juridiques Lieu : Nantes Université, Laboratoire des Sciences Numériques de Nantes, Equipe du Traitement Automatique du Langage Naturel [1] Date de début : Janvier 2024 (flexible) ~6 mois Encadrement : Christine Jacquin et Nicolas Hernandez Gratification : ~600 euros Description : Les documents juridiques (contrats, jurisprudence, etc.) sont connus pour être longs et utiliser un langage de spécialité qui rend leur lecture fastidieuse et leur compréhension difficile. L'objectif de ce projet est d'étudier la génération automatique de titres de sections des textes de loi de la cour suprême américaine. En effet, bien que ces textes soient logiquement structurés en paragraphes et en sections, ils comptent fréquemment plusieurs centaines de pages sans pour autant avoir des titres à leurs sections. L'étude pourra s'inspirer des travaux en résumé automatique et en extraction de mots clefs. Différentes approches peuvent être envisagées : à base de grands modèles de langue, de modèles extractifs ou génératifs, de techniques qui exploitent le caractère multi-documents... À des fins de comparaison et de transfert de techniques, le travail sera effectué sur des données provenant à la fois de la Cour européenne des droits de l'homme (dont la structure des textes comporte des titres) et de la Cour suprême des Etats-Unis d'Amérique. Cette recherche est financée par l'Agence nationale de la recherche française dans le cadre du projet Lexhnologie ANR-22-CE38-0004 [2]. [1] http://taln.ls2n.fr [2] https://lexhnology.hypotheses.org/ Candidature : Nous accueillons des candidatures d'étudiants préparant un Master ou équivalent avec de solides compétences (et idéalement une expérience) en traitement du langage naturel, apprentissage automatique et apprentissage profond. D'excellentes compétences verbales et écrites en anglais sont également essentielles. Pour postuler à ce stage, veuillez envoyer un email avec votre Curriculum Vitae, un document avec vos résultats académiques, et quelques mots expliquant votre intérêt pour ce projet à Christine Jacquin ET Nicolas Hernandez (firstname.lastname@univ-nantes.fr).