Lieu du stage : laboratoire d'Informatique de Grenoble (LIG), Grenoble. Selon les modalités imposées par la situation sanitaire, le stage pourra se dérouler en télé-travail. Encadrants : Emmanuelle Esperança-Rodier, Francis Brunet-Manquat (GETALP) * Domaine : Annotation de corpus * Thématique : Traitement automatique des langues - Traduction - IA * Descriptif L'analyse des erreurs de traduction est une tâche qui a été développée afin d'améliorer et d'évaluer qualitativement les systèmes de traduction automatique (TA). Effectuée manuellement, cette tâche prend beaucoup de temps et, par conséquent, certaines recherches sont menées sur l'analyse automatique des erreurs de traduction (Popovic, 2006). D'autres travaux tels que ceux de Vilar et al. (2006), Felice et al. (2012), Wisniewski et al. (2013.a) ou Lommel (2018) traitent des critères d'analyse des erreurs, tandis que d'autres abordent le développement de corpus d'erreurs de traduction et la correction d'erreurs de traduction comme Potet et al. (2012) et Wisniewski et al. (2013.b). D'autres se concentrent sur l'estimation de la qualité avec Quest ++ (Specia, 2015), ou sur la mise en oeuvre d'outils d'analyse d'erreur tels que Germann (2008), Tsoumari (2011), Stymne (2011) ou Steurs (2015). C'est là que nous nous positionnons. Cependant, nous nous démarquons de ces travaux en créant un outil collaboratif, qui peut être utilisé comme une application autonome, mais aussi dans le cadre de la chaîne de traitement des corpus. La plateforme ACCOLÉ propose une palette de services permettant de répondre aux besoins d'analyse d'erreurs. Notre plateforme permet d'analyser les erreurs de traductions sur différents corpus, en collaboration avec différentes personnes. La plateforme est accessible en ligne et il est possible soit de téléverser les éléments suivants : corpus, typologie d'erreurs, résultats d'analyseurs morphosyntaxiques ; soit d'utiliser ceux présents sur la plateforme. Une vidéo d'usage de la plateforme est disponible à l'adresse suivante : https://lig-membres.imag.fr/fbrunet/accole-plateforme-pour-ledition-collaborative-derreurs/ La plateforme ACCOLÉ a permis l'annotation de 30 projets, créés à partir de 15 corpus FR-GB, 7 corpus GB-DE, et 3 corpus monolingues FR et GB, soient 25 corpus au total, 4 typologies d'erreurs, soient 9 585 couples (phrase source/phrase cible). Ces projets représentent 34 558 annotations réalisées par un total de 12 annotateurs natifs anglais, français ou allemand. Les corpus sont constitués de textes alignés (sources/traduction) GB-FR, FR-GB, GB-DE, et se répartissent en 4 domaines : technique, journalistique, littéraire et médical. L'objectif de notre projet actuel est de réaliser un outil d'apprentissage d'annotation d'erreurs par réseau de neurones, en évaluant les techniques à notre disposition, afin de mener à bien l'apprentissage à partir des corpus déjà annotés et l'annotation supervisée de nouveaux corpus. Pour cela, nous devons préparer les corpus déjà annotés obtenu avec ACCOLÉ, et créer de nouveau corpus annotés. C'est pourquoi nous offrons les trois stages suivant. * Offre de stage 3 : Apprentissage d'annotation d'erreurs par réseau de neurones Le stage portera sur la recherche du système neuronal le mieux adapté à l'annotation d'erreurs, étant donné le nombre d'annotations disponible pour l'apprentissage, ainsi que sur la proposition d'un système d'annotation automatique d'erreurs et/ou d'EPL. L'étudiant·e devra donc étudier la possibilité d'un apprentissage d'annotation par réseau de neurones à partir des corpus annotés via ACCOLÉ, et effectuer l'implémentation du système neuronal choisi afin d'effectuer l'entrainement, le « tuning » et le test de ce système d'annotation automatique neuronal. Ce stage permettra de créer rapidement des corpus annotés, et de les rendre disponibles pour la communauté des linguistes, du TAL et de la Traductologie. * Public visé Ce stage s'adresse à un(e) étudiant(e) de niveau Master 2, de formation informatique. * Conditions du stage Stage de 5 à 6 mois, à partir du printemps 2020, indemnisé suivant les conditions en vigueur. Convention de stage obligatoire. * Comment candidater ? Envoyer un mail expliquant votre intérêt pour le stage choisi, et en pièces jointes un CV et un relevé de notes récent. Adresser le mail à Emmanuelle Esperança-Rodier (Emmanuelle.Esperanca-Rodier@univ-grenoble-alpes.fr)