|
|
Les expériences en question sont de type "extraction
d'information", incluant des dérivés comme
le marquage (ou annotation) sémantique de textes par des
informations structurées. Le titre entend insister sur
le fait qu'il s'agit là de formes (partielles, limitées,
sélectives) de compréhension automatique, dans lesquelles
diverses questions liées au rapport formes linguistique
- sens - information sont posées. Nous commencerons par
présenter ces expériences. La dimension "corpus"
est ici essentielle, et nous aborderons diverses questions concernant
la définition des corpus (qu'est-ce qu'un corpus "homogène" ?),
leur analyse et leur traitement informatique. Des questions plus
générales pourront alors être évoquées
concernant la notion d'information en sémantique (articulation
sens-information, en quelque sorte) ou encore la question des
"méthodes formelles" pour une "sémantique
de corpus".
|
|