Du point de vue du TALN, où domine le souci d'opérationnalité, les questions sur la nature de ces unités inférieures sont rares. Le souci de leur manipulation les ramène classiquement à des unités symboliques manipulées par la logique.
Dès lors que la question se pose, la réponse est souvent recherchée dans le cognitif, lieu privilégié d'explication des phénomènes du langage et de la compréhension comme nous l'avons vu. Les travaux de J.-P. Desclés [4] sur la grammaire applicative et cognitive, cherche ainsi une justification des archétypes descriptifs, la grammaire cognitive de Langacker également [16, 17].
D'autre modèles proposent un point de vue encore plus absolu, comme les travaux mathématiques de R. Thom [29], répercutés dans la langue par B. Pottier [22, 23]. On peut dans ce cas parler de noèmes, par l'universalisme qu'oblige une mathématisation forte. Bien que séduisants, ces modèles perdent malheureusement en opérationnalité, notamment par la perte de la centrale notion de continuité qu'entraîne le passage à la machine.
Une dernière possibilité est de rester dans le linguistique, et de revendiquer son autonomie en utilisant des descripteurs de forme langagière. Cette alternative permet d'échapper aux lourdes présuppositions d'un cognitivisme ou d'un universalisme, tout en restant manipulable. Sa réalisation passe par l'utilisation de marqueurs sémantiques, ou @sèmes, et l'on parle alors de microsémantique.