JOURNÉES GENRE TEXTUEL/DOMAINE/ACTIVITÉ
30/03/2006, Toulouse

[ Retour au programme... ]

Alessandro Zinna
Type et genre de « corpus numérique »


Cette intervention s'interroge sur les contours et l'extension de la notion de « corpus numérique ». D'une part, les exemplaires peuvent être, selon les cas, numériques et/ou numérisés, autrement dit, n'avoir que d'existence numérique ou être le résultat d'une conversion analogique/numérique ; d'autre part, cette notion peut inclure différents types sémiotiques (monomodales vs multimodales) et genres de discours.
En effet, la numérisation, ainsi dans le cas d'un corpus monomodale, par exemple celui de l'écriture, peut concerner la simple transcription des caractères du document d'origine (la « modalité texte ») ou l'ensemble de l'objet d'écriture (la « modalité image »). Cette dernière modalité de documentation prend aussi en charge la documentation du support de l'objet écrit. Ce choix dans la constitution d'un corpus d'écritures, en modalité texte ou image, est en relation avec la finalité de l'opération de documentation, et pose des questions concernant les niveaux et les degrés de fidélité à l'originale. Ces choix dans la constitution du corpus numérique selon le type et le genre d'exemplaires comportent, par conséquent, différentes pratiques de classement et de trie automatique.
Le but de cette intervention est de montrer les opérations logiques qui président à toute constitution d'un corpus afin de délimiter les spécificités dans le traitement du corpus numérique selon le type de texte et le genre de discours.