Rencontres « Sémantique et Corpus »
Ce que l'analyse de corpus apporte à la réflexion sur le sens

Université de Toulouse-le Mirail
20 et 21 mars 2002


Contact : anne.condamines@univ-tlse2.fr

Accès au site ]
Toulouse ] (site de la mairie de Toulouse)
Programme ]

Les « Rencontres Sémantique et corpus » organisées par l'Opération « Sémantique et corpus » de l'ERSS ont pour ambition de faire se rencontrer différents points de vue sur la question du sens en lien avec l'analyse de corpus. Cette thématique est rarement discutée en tant que telle ; pourtant, différents courants de recherche des sciences du langage utilisent un corpus comme point de départ, voire, comme référence ; on peut citer par exemple :
  • la linguistique historique et comparative ;
  • l'analyse littéraire ;
  • la terminologie ;
  • la sociolinguistique ;
  • l'analyse de discours ;
  • le traitement automatique de la langue (en tout cas une partie des travaux).

Le recours à des corpus est incontournable lorsque le linguiste n'a pas de compétence sur l'usage linguistique qu'il étudie (corpus historiques ou spécialisés) ; il ne peut donc recourir à une approche introspective. En analyse littéraire, ce qui fait saillance est bien souvent plus ce qui renvoie à un fonctionnement original qu'à un fonctionnement systématique. En sociolinguistique, l'analyse d'usages réels fait partie de l'hypothèse variationiste qui soutient les recherches ; la question de la stabilité sémantique intertextuelle est ainsi minimisée, tout comme elle l'est dans l'analyse de discours, qui donne au corpus un rôle prépondérant. En TAL, la confrontation ultime avec la réalité des usages amène de plus en plus de chercheurs à prendre en compte ce réel très tôt dans la mise en place des études.

Dans ces analyses, le sens apparaît nécessairement en filigrane soit parce que, considéré comme stable, il soutient l'analyse syntaxique et morphologique et permet d'étudier la variation, soit parce que, insaisissable par hypothèse, il est toujours le fruit d'une construction et que seules les modalités de cette construction sont accessibles ; on ne perçoit donc du sens que ses effets, psychologiques ou sociaux.

L'objectif de ces rencontres est de mettre en lumière la place du sens dans l'élaboration des résultats d'analyse à partir de corpus. Il s'agit de savoir quelle part de connaissance sémantique est convoquée a priori par la mise en œuvre des études sur corpus et quelle part est construite par ces études. Cette problématique peut se décliner selon divers thèmes :

  • sens et signification ;
  • sens et information ;
  • stabilité et variation ;
  • rôle du co-texte ;
  • rôle du contexte ;
  • système et usages ;
  • reproductibilité et validité des résultats…


Programme

Mercredi 20 mars 2002
9:00 Accueil
10:00 Sylvie Mellet (BCL, CNRS, Nice) - Les corpus informatisés améliorent-ils l'accès au sens des textes latins ?  Résumé... ]
10:45 Bernard Combettes (ATILF, Université de Nancy) - Les études sur la grammaticalisation : problèmes sémantiques et contextuels dans l'utilisation des corpus informatisés  Résumé... ]
11:00 Pause
11:45 Anne Condamines (ERSS, Université Toulouse-le Mirail) - Ce que la constitution de terminologies à partir de corpus apprend sur la compétence linguistique  Résumé... ]
12:30 Hélène Miguet (ERSS, Université Toulouse-le Mirail) - Les études sur la grammaticalisation : problèmes sémantiques et contextuels dans l'utilisation des corpus informatisés
14:30 Benoît Habert, Limsi et MoDyco (Université Parix X) - Le monde bouge, les mots aussi : repérer les fluctuations de sens  Résumé... ]
15:15 Adeline Nazarenko (LIPN, Université Paris XIII) - Acquisition de connaissances à partir de corpus : élaborer des ressources pour l'extraction d'information  Résumé... ]
16:00 Pause
16:30 Francçois Rastier (MoDyCo, Université Paris X) - Parcours interprétatifs et structures de corpusRésumé... ]
17:15 Dominique Desmarchelier (Ceditec-Paris 12 et CNRS-ENS Lyon) - Le sens du texte : entre opacité statistique et transparence énonciative  Résumé... ]
18:00 Michelle Lecolle (ATILF, Université de Nancy) - Les études sur la grammaticalisation : problèmes sémantiques et contextuels dans l'utilisation des corpus informatisés  Résumé... ]

Jeudi 21 mars 2002
9:00 Patrice Enjalbert (GREYC, Caen) - Formes linguistiques et structure de l'information. Expériences en compréhension automatique  Résumé... ]
9:45 François Gaudin, Maryvonne Holzem, Thierry Wable (Dyalang, Université de Rouen) - Analyse sémantique et corpus : le cas des résumés de thèses  Résumé... ]
10:30 Pause
11:00 Sophie Prévost (LaTTICE, Paris) - Catégorisation et élaboration d'une typologie des textes dans la Base de Français Médiéval
11:45 Cécile Fabre et Cécile Frérot (ERSS, Université Toulouse-le Mirail) - Arguments vs circonstants : une distinction repérable par des méthodes d'analyse automatique de corpus ?Résumé... ]
12:15 Marie-Paule Jacques (ERSS, Université Toulouse-le Mirail) - Comparaison de corpus pour l'étude de la réduction de termes complexesRésumé... ]
14:15 Jean Véronis (DELIC, Université de Provence) - Vers une lexicographie distributionnelle :Résumé... ]
15:00 Jean-Luc Minel (LaLICC, Paris) - Filtrage sémantique de textes. Réflexions à partir de quelques applications.Résumé... ]
15:45 Nabil Hathout (ERSS, Université Toulouse-le Mirail) - Utilisation des corpus pour déterminer le sens des lexèmes construits
16:15 Didier Bourigault (ERSS, Université Toulouse-le Mirail) - Analyse syntaxique automatique et analyse sémantique de corpus