next up previous
Next: Définition de l'ordre sur Up: Vers une forme manipulable Previous: Projection de l'isotopie sur

Introduction de la notion d'épisémème

  Jusqu'ici, nous n'avons considéré les sémèmes en soi que comme des éléments identitairement typés de l'ensemble S. La réalité de la relation d'identité tex2html_wrap_inline775 se situe au niveau de la forme (chaîne de caractères) des lexies formant les sémèmes. Les problèmes apparaissent lors de la répétition d'une même chaîne dans un même texte. Autrement dit, si le mot <<chat>> apparaît 42 fois dans un texte, y a-t-il 42 sémèmes ou un seul répété à 42 positions différentes ? Nous retombons ici en pleine polysémie, phénomène obsessionnel dans le TALN. Nous avons déjà évoqué les problèmes de l'identité sémantique des sémèmes et nous sommes parvenus à la conclusion que deux sémèmes différents se situaient à deux places bien distinctes dans la structure sémantique (même si certaines projections de ces emplacements pouvaient être identiques). Nous devons tout de même être en mesure de traiter le cas de deux chaînes identiques supportant des considérations sémiques distinctes.

Citons comme exemple un cas classique de polysémie forte (que F. Rastier qualifie comme des sens distincts) : 'pomme' comme fruit (taxème des //fruits//) ou comme partie d'instrument ('pomme' d'arrosoir). Dans ce cas, aucun sème micro ou mésogénérique ne sera commun entre ces deux sémèmes. Les formalismes classiques de l'IA parleraient de pomme#1 et de pomme#2, ou de deux concepts distincts. Il est cependant possible que ces deux sémèmes aient des sèmes spécifiques ou afférents en commun, par exemple /sphéricité/.

Mais il y a des différences plus subtiles (des acceptions selon la sémantique interprétative), comme par exemple entre 'église' comme bâtiment : <<la porte de l'église>> ou comme institution : <<les pères de l'église>> (ou <<de l'Église>> ?). Il est sain de songer que les sèmes génériques (du moins micro- et méso-génériques) de ces deux sémèmes seront identiques (/religion/ et/ou /christianisme/ par exemple). Mais des distinctions peuvent apparaître dans leurs sèmes spécifiques ou afférents : /bâtiment/ ou /institution/ entre autres.

Enfin, le long de la même échelle nous pouvons glisser jusqu'à des cas limites mais néanmoins très intéressants car généralement laissés en friche par le TALN classique. Pour reprendre un exemple déjà en partie explicité lors du précédent chapitre, citons l'adjectif 'rouge' dans <<Le rouge et le Noir>>. À part dans le titre, cette lexie peut apparaître dans le texte sous une occurrence que le contexte ne pousse guère à interpréter comme symbolisant l'armée. Par exemple, quand Julien doit décorer l'église avec du damas rouge. Pourtant, dans les deux cas de figure, il s'agit du même sémème rouge, défini dans le taxème des //couleurs// par le sème spécifique /rougeur/. En fait, seule l'afférence locale variegif. C'est donc le cas de deux emplois distincts.

Dans tous les cas plus ou moins classiques que nous venons de citer, sans pour autant vouloir les justifier, nous devons admettre que la simple forme ne suffit pas à distinguer les simples éléments de S. Il nous faut en plus un critère positionnel afin de respecter l'unicité des occurrences. Cependant, il est tout de même appréciable de pouvoir assimiler plusieurs occurrences qui supportent des considérations sémantiques unifiées. La répétition d'un même terme le long d'un texte est de façon typique la source d'isotopies, triviales certes, mais à prendre en compte systématiquement.

Donc, si nous séparons les sémèmes suivant leurs positions, nous devons préserver leur unicité sémantique, sans pour autant avoir à comparer leurs sèmes. De plus, selon les définitions et contraintes que nous avons posées, il est impossible que deux sémèmes distincts suivant tex2html_wrap_inline775 supportent des considérations sémantiques strictement identiques (identité forte selon SE).

C'est donc après ces longs détours théoriques que nous allons introduire la notion d'épisémème, afin de tenir compte des positions physiques des termes dans un texte. Nous verrons de plus par la suite comment utiliser ces critères positionnels pour qualifier les isotopies.

L'ensemble des positions des termes interprétés d'un texte forme l'ensemble E des épisémèmes. L'identité inhérente à E se base strictement sur la position. L'identité des chaînes de caractères n'est donc plus qu'un phénomène périphérique et non suffisant. L'ensemble des sémèmes S devient donc un ensemble extensionnel basé sur E : un sémème sera un ensemble d'épisémèmes. Le reste des considérations sur S demeure bien entendu inchangé.

Nous intégrons dans les relations entre E et S les contraintes suivantes :

En fait, la relation liant S à E est une simple relation de positionnement. Nous ne nous étendrons pas longuement sur les propriétés de cette relation ni sur celles de E, vu que l'utilisation de celle-ci sera restreinte aux seules isotopies, pour des considérations de tactique. Cependant, l'intérêt majeur de ce nouvel ensemble E est qu'il supporte une structure d'ordre total, en partie récupérable par S, comme nous allons le voir ci-dessous.

Définissons tout de même la réciproque de cette relation, l'extension de S sur E : tex2html_wrap_inline1589 , qui a un sémème s associe un sous-ensemble de S contenant les épisémèmes qui lui correspondent, si ceux-ci existent (ext(s) peut être l'ensemble vide).


next up previous
Next: Définition de l'ordre sur Up: Vers une forme manipulable Previous: Projection de l'isotopie sur

Ludovic TANGUY
Fri Dec 5 17:09:15 MET 1997