Les Voisins De Le Monde est une base lexicale distributionnelle du français construite automatiquement, à partir d'un corpus comprenant l'ensemble des articles du quotidien Le Monde sur une période de 10 ans (1991-2000). (En collaboration avec Didier Bourigault)
Les Voisins D'En Face est une application qui permet de comparer deux bases lexicales distributionnelles du français, issus de deux corpus de 30 millions de mots chacun : les articles du quotidien Le Monde sur une période d'un an (sous-partie de la base Les Voisins De Le Monde) et de 515 romans du 20ème siècle issus de la base Frantext, de l'ATILF. (En collaboration avec Didier Bourigault)
LexiMédia2007 permet de suivre l'actualité des élections présidentielles de
2007 semaine après semaine :
les articles des journaux Le
Monde, Libération
et Le Figaro sont analysés en permanence
et LexiMédia2007 présente l'évolution au fil des semaines des syntagmes
extraits. (En collaboration avec Didier Bourigault)
Trifouillette,
un outil de recherche automatique de créations lexicales sur
le web francophone.
Prox : développé par Bruno Gaume
et Yannick Chudy.
Catégorisation de DicoSyn (dictionnaire des synonymes) :
Mai Ho-Dac et Franck Sajous.
Chaîne d'étiquetage morphosyntaxique
Description détaillée des différents modules de la chaîne de traitement
mise en place à l'ERSS :
tokenisation, segmentation en phrases, étiquetage, XMLisation... (En collaboration avec Ludovic Tanguy)
Projets
Impliqué de près ou de loin dans les projets suivants :
ANNODIS (Annotation discursive de corpus) : projet coordonné
par Marie-Paule Péry-Woodley (CLLE-ERSS) en collaboration avec l'IRIT et le GREYC.
RHECITAS : projet TGE-ADONIS sur la rhétorique des citations dans les articles de SHS,
coordonné par Ludovic Tanguy (CLLE-ERSS), en partenariat avec l'IRIT,
l'INIST et Synapse Développement.
TELOC
(Textes En Langue Occitane) : projet coordonné par Myriam Bras (CLLE-ERSS)
en collaboration avec le CNRTL, le CROM et Ciel d'Òc
M3 (Model and measurement of meaning) : A cross-lingual and multi-disciplinary approach of
French and Mandarin verbs based on distance in paradigmatic graphs.
Projet ANR coordonné par Bruno Gaume (CLLE-ERSS) en collaboration avec Sinica Institute (Taïpei).
QUAERO, tâche multidimensional ranking,
coordonnée par Bruno Gaume (CLLE-ERSS)
E. Navarro, F. Sajous, B. Gaume, L. Prévot, S. Hsieh, I. Kuo, P. Magistry and Chu-Ren Huang (2009).
Wiktionary and NLP: Improving synonymy networks.
In Proceedings of the ACL Workshop on The People's Web Meets NLP: Collaboratively Constructed Semantic Resources.
ACL-IJCNLP 2009, Singapore.
[ Paper ]
[ Slides ]
[ Dataset ]
[ Bibtex ]
N. Hathout, F. Sajous and L. Tanguy (2009).
Looking for French deverbal nouns in an evolving Web (a short history of WAC).
In Proceedings WAC5: 5th Workshop on Web As Corpus, San Sebastian, pp. 37-44.
[ Paper ]
[ Bibtex ]