Jusqu'ici, nous n'avons considéré les sémèmes en soi que
comme des éléments identitairement typés de l'ensemble S. La réalité
de la relation d'identité se situe au niveau de la forme (chaîne
de caractères) des lexies formant les sémèmes. Les problèmes
apparaissent lors de la répétition d'une même chaîne dans un même
texte. Autrement dit, si le mot <<chat>> apparaît 42 fois dans un
texte, y a-t-il 42 sémèmes ou un seul répété à 42 positions
différentes ? Nous retombons ici en pleine polysémie, phénomène
obsessionnel dans le TALN. Nous avons déjà évoqué les problèmes de
l'identité sémantique des sémèmes et nous sommes parvenus à la
conclusion que deux sémèmes différents se situaient à deux places bien
distinctes dans la structure sémantique (même si certaines projections
de ces emplacements pouvaient être identiques). Nous devons tout de
même être en mesure de traiter le cas de deux chaînes identiques
supportant des considérations sémiques distinctes.
Citons comme exemple un cas classique de polysémie forte (que F. Rastier qualifie comme des sens distincts) : 'pomme' comme fruit (taxème des //fruits//) ou comme partie d'instrument ('pomme' d'arrosoir). Dans ce cas, aucun sème micro ou mésogénérique ne sera commun entre ces deux sémèmes. Les formalismes classiques de l'IA parleraient de pomme#1 et de pomme#2, ou de deux concepts distincts. Il est cependant possible que ces deux sémèmes aient des sèmes spécifiques ou afférents en commun, par exemple /sphéricité/.
Mais il y a des différences plus subtiles (des acceptions selon la sémantique interprétative), comme par exemple entre 'église' comme bâtiment : <<la porte de l'église>> ou comme institution : <<les pères de l'église>> (ou <<de l'Église>> ?). Il est sain de songer que les sèmes génériques (du moins micro- et méso-génériques) de ces deux sémèmes seront identiques (/religion/ et/ou /christianisme/ par exemple). Mais des distinctions peuvent apparaître dans leurs sèmes spécifiques ou afférents : /bâtiment/ ou /institution/ entre autres.
Enfin, le long de la même échelle nous pouvons glisser jusqu'à des
cas limites mais néanmoins très intéressants car généralement laissés
en friche par le TALN classique. Pour reprendre un exemple déjà en
partie explicité lors du précédent chapitre, citons l'adjectif 'rouge'
dans <<Le rouge et le Noir>>. À part dans le titre, cette lexie peut
apparaître dans le texte sous une occurrence que le contexte ne pousse
guère à interpréter comme symbolisant l'armée. Par exemple, quand
Julien doit décorer l'église avec du damas rouge. Pourtant, dans les
deux cas de figure, il s'agit du même sémème rouge, défini dans le
taxème des //couleurs// par le sème spécifique /rougeur/. En fait,
seule l'afférence locale varie. C'est donc le cas de deux
emplois distincts.
Dans tous les cas plus ou moins classiques que nous venons de citer, sans pour autant vouloir les justifier, nous devons admettre que la simple forme ne suffit pas à distinguer les simples éléments de S. Il nous faut en plus un critère positionnel afin de respecter l'unicité des occurrences. Cependant, il est tout de même appréciable de pouvoir assimiler plusieurs occurrences qui supportent des considérations sémantiques unifiées. La répétition d'un même terme le long d'un texte est de façon typique la source d'isotopies, triviales certes, mais à prendre en compte systématiquement.
Donc, si nous séparons les sémèmes suivant leurs positions, nous
devons préserver leur unicité sémantique, sans pour autant avoir à
comparer leurs sèmes. De plus, selon les définitions et contraintes
que nous avons posées, il est impossible que deux sémèmes distincts
suivant supportent des considérations sémantiques strictement
identiques (identité forte selon SE).
C'est donc après ces longs détours théoriques que nous allons introduire la notion d'épisémème, afin de tenir compte des positions physiques des termes dans un texte. Nous verrons de plus par la suite comment utiliser ces critères positionnels pour qualifier les isotopies.
L'ensemble des positions des termes interprétés d'un texte forme l'ensemble E des épisémèmes. L'identité inhérente à E se base strictement sur la position. L'identité des chaînes de caractères n'est donc plus qu'un phénomène périphérique et non suffisant. L'ensemble des sémèmes S devient donc un ensemble extensionnel basé sur E : un sémème sera un ensemble d'épisémèmes. Le reste des considérations sur S demeure bien entendu inchangé.
Nous intégrons dans les relations entre E et S les contraintes suivantes :
En fait, la relation liant S à E est une simple relation de positionnement. Nous ne nous étendrons pas longuement sur les propriétés de cette relation ni sur celles de E, vu que l'utilisation de celle-ci sera restreinte aux seules isotopies, pour des considérations de tactique. Cependant, l'intérêt majeur de ce nouvel ensemble E est qu'il supporte une structure d'ordre total, en partie récupérable par S, comme nous allons le voir ci-dessous.
Définissons tout de même la réciproque de cette relation, l'extension
de S sur E : , qui a un sémème s
associe un sous-ensemble de S contenant les épisémèmes qui lui
correspondent, si ceux-ci existent (ext(s) peut être l'ensemble
vide).