logo

ANNODIS
Annotation Discursive

un corpus de référence annoté discursivement
+ outils d'annotation et d'exploitation de corpus annotés

english logo

logo
logo
ANR

ANNODIS est un projet multidisciplinaire (linguistique, logique, TAL) né de la collboration de trois laboratoires français :

Ce projet financé par L'Agence National pour la Recherche (ANR) a démarré en Décembre 2007.

Sommaire

objectifs haut

Le projet ANNODIS a pour objectif la construction d'un corpus annoté et outillé. Ce corpus sera une référence pour l'étude de l'organisation du discours en français. Les annotations proposées se situeront à deux niveaux d'analyse:

La construction du corpus est associée à la création de deux interfaces : une première ayant pour rôle d'aider l'annotation des structures discursives et une seconde d'exploiter les annotations produites. La construction de ces interfaces est dirigée par l'équipe du GREYC.(en savoir plus...)

Présentation du projet lors de l'UE TAL (petit bilan des 10 premiers mois du projet)

Methodologie haut

Un corpus diversifié et disponible

Trois caractéristiques principales du corpus:

Utilisation générale d'outils issus du TAL pour préparer l'annotation

Campagne d'annotation

  1. Définition des spécifiations pour guider l'annotation humaine des :
  2. Evaluation des spécifications : application des manuels d'annotation par les membres du projets sur une sélection de textes
  3. Campagne d'annotation avec annotateurs "neutres"

Toutes les procédures d'annotation sont assistées par ordinateur.

Techniques d'apprentissage et de fouille de données sur le corpus annoté pour découvrir des corrélations entre indices de surface et structures

Equipe haut


haut