Rencontres « Sémantique et Corpus »
Ce que l'analyse de corpus apporte à la réflexion sur le sens

Formes linguistiques et Structure de l'information - Expériences en compréhension automatique (limitée)
Patrice Enjalbert (GREYC, Caen)

Les expériences en question sont de type "extraction d'information", incluant des dérivés comme le marquage (ou annotation) sémantique de textes par des informations structurées. Le titre entend insister sur le fait qu'il s'agit là de formes (partielles, limitées, sélectives) de compréhension automatique, dans lesquelles diverses questions liées au rapport formes linguistique - sens - information sont posées. Nous commencerons par présenter ces expériences. La dimension "corpus" est ici essentielle, et nous aborderons diverses questions concernant la définition des corpus (qu'est-ce qu'un corpus "homogène" ?), leur analyse et leur traitement informatique. Des questions plus générales pourront alors être évoquées concernant la notion d'information en sémantique (articulation sens-information, en quelque sorte) ou encore la question des "méthodes formelles" pour une "sémantique de corpus".