Next: Taxèmes
Up: Codage de la structure
Previous: Codage de la structure
La structure d'un sémème est un enregistrement, comportant les données
suivantes :
- Lexie : la chaîne de caractères correspondant au signifiant du
sémème.
- Positions : une liste de coordonnées des épisémèmes supportant
ce sémème. Une coordonnée est un simple couple d'entiers (numéro de
ligne, numéro de colonne) correspondant au premier caractère de la
chaîne dans le texte.
- Marqueur de lexicalisation : une valeur booléenne, indiquant
simplement si le sémème possède ou non des épisémèmes dans le
texte. Cette valeur est donc à vrai si la liste des
positions n'est pas vide.
- Numéro de taxème : un lien avec le taxème qui contient ce
sémème. Cette valeur correspond à la position du taxème dans la
liste totale des taxèmes. Elle est donc unique pour chaque sémème.
- Numéros de spécèmes : de la même façon que pour le taxème, une
série de liens directs avec les numéros des spécèmes ayant ce sémème
comme première projection, correspondant également aux positions de
ces spécèmes dans la liste totale des spécèmes.
- Numéros des isotopies d'afférence : une dernière série de liens
directs avec les isotopies qui possèdent le sémème dans leur
troisième composante (pour traduire un sème afférent au sémème).
Enfin, tous les sémèmes repérés dans un texte sont stockés dans une
seule liste, et seront par la suite repérés par leur position dans la
liste. Il est important de noter que l'ordre des sémèmes dans la liste
est totalement arbitraire, et ne traduit en aucun cas l'ordre
syntagmatique.
Ludovic TANGUY
Fri Dec 5 18:02:55 MET 1997