Algorithme alternatif pour le calcul des probabilités dans des champs aléatoires conditionnels (CRF) Les champs aléatoires conditionnels (CRF) sont actuellement un des modèles les plus performants dans les tâches d'étiquetage de séquences et d'analyse syntaxique [1,2]. Malgré des améliorations récentes [3], apprendre ce modèle reste relativement coûteux, notamment à cause des algorithmes utilisés pour le calcul des probabilités du modèle. Cependant dans plusieurs tâches de Traitement Automatique de Langues (TAL), l'information prédite automatiquement a une annotation assez creuse. Ceci suggère des algorithmes alternatifs qui prennent en compte cette caractéristique pour réduire la complexité computationnelle dans les calculs des probabilités des CRF. Au cours de ce stage le candidat développera un algorithme alternatif pour le calcul des probabilités des modèles CRF. Ceci apportant deux avantages. D'une part la possibilité d'entraîner un modèle CRF plus rapidement. D'autre part cette réduction du coût computationnel permettra d'entraîner des modèles plus complexes, ce qui pourra mener à de meilleurs résultats sur une tâche donnée. Le candidat expérimentera l'algorithme développé sur une tâche de TAL spécifique. [1] Lavergne, Thomas and Cappé, Olivier and Yvon, François. 2010 Practical Very Large Scale CRFs. Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics (ACL) [2] Jenny Rose Finkel, Alex Kleeman, and Christopher D. Manning. 2008. Efficient, Feature-based, Conditional Random Field Parsing. Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics (ACL) [3] Naoaki Okazaki. 2007. CRFsuite: a fast implementation of Conditional Random Fields (CRFs). Profil recherché : - stage de niveau M2 en informatique ou école d'ingénieur, - compétences en informatique : programmation (C), langage de script (lua), manipulation de corpus, - intérêt pour le Traitement Automatique des Langues, - compétences en apprentissage automatique avec modèles probabilistes. Le stage peut durer de 4 à 6 mois au sein du Lattice (http://www.lattice.cnrs.fr), à partir de mars/avril 2015. Il sera encadré par Marco Dinarelli (www.marcodinarelli.it) et sera financé suivant les règles en vigueur. Envoyer CV + lettre de motivation à marco.dinarelli@ens.fr