next up previous
Next: Syntaxe linguistique et syntaxe Up: Place de la syntaxe Previous: Place de la syntaxe

Prédominance de la syntaxe dans le TALN

Revenons quelques temps sur les tentatives initiales en traduction automatique, telles qu'elles fleurirent après la dernière guerre, motivées par la volonté américaine de traduire automatiquement les messages russes. Les productions en ce sens, avant d'être déclarées inutilisables par la comité ALPACgif en 1965, s'appuyaient essentiellement sur l'utilisation de correspondances mot-à-mot. Les traditions sous-jacentes à l'époque provenaient plus de la cryptographie (dont le succès dans son traitement informatique était validé) que de la linguistique véritable.

À partir de là, deux programmes majeurs furent envisagés au vu des échecs : affiner l'analyse syntaxique ou apporter des connaissances générales au système. On peut citer par exemple Weaver, reconnaissant que le <<décodage du russe vers l'anglais>> [34] est plus complexe qu'une simple correspondance, et Bar-Hillel [3], qui reconnaît le besoin de connaissances sur le monde, et non plus sur la langue (lexique et grammaire) pour parvenir à une traduction acceptable. S'affirment donc deux programmes : le premier vise l'affinement syntaxique (comme affinement/complexification de la structure) ; le second concerne le mode de coordination du thème de la connaissance avec l'objet linguistique.

Pour l'instant, nous étudierons la première possibilité : développement des méthodes d'analyse morphologique (dictionnaire de formes simples et règles de composition des mots, cela dès les premières tentatives de traduction, pour diminuer la place en mémoire des dictionnaires), et surtout syntaxique, afin de déterminer la structure de la phrase, et atteindre ainsi une meilleure compréhension, donc traduction. Dans le cas de la traduction, cela suppose toujours une correspondance, non plus au niveau du mot, mais au moins au niveau du syntagme et de la proposition.

Ceci se traduit également par le développement de formalismes syntaxiques originaux, à partir des simples grammaires syntagmatiques, en cherchant à atteindre un taux de couverture maximal des phrases correctes analysées. À ce propos nous ne pouvons bien entendu pas nous affranchir de citer les travaux de Chomsky [10, 11], et leur abondante tradition critique qui a nourri presque toute la recherche en TALN, qui s'inscrivent pleinement dans cette vision du sens (structure profonde) accessible par la forme (structure de surface). Nous ne nous lancerons pas dans une critique maintes fois proposée, mais reconnaîtrons simplement que la théorie de la grammaire transformationnelle constitue l'approfondissement le plus notable de cette vision générale.

Ces formalismes ne furent pas utilisés exclusivement à des fins de traducteurs automatiques. Une grande majorité d'outils de TALN utilisent un analyseur morpho-syntaxique ou parser. Que ces outils servent à l'interrogation de bases de données en langage naturel, à la production de résumé ou l'indexation de documents, en bref des outils qui visent à une certaine forme de compréhension de la langue, ils passent presque toujours par une phase purement syntaxique. C. Fuchs [15] reconnaît à la syntaxe un statut de nécessité pour la généralité de l'outil, dans le sens de la variété des énoncés que celui-ci traite. À travers des domaines variés, de la météorologie à la classification des bateaux [18], en passant par la simulation de dialogues psychanalytiques [36] (de nombreux ouvrages discutent de ces différents outils, notamment [4], [13], [27]), la constante serait donc la structure syntaxique, sorte de substrat originel de la langue. D'ailleurs cette primauté doit être remise en question, dans la mesure où elle contredit des données établies en psychologie expérimentale. On peut en effet établir facilement l'accès de l'enfant à la langue par la sémantique, et l'apparition tardive d'une compétence syntaxique (voir à ce propos les travaux de J. Piaget [23]). Parle-t-on alors de la même syntaxe dans les deux cas ?


next up previous
Next: Syntaxe linguistique et syntaxe Up: Place de la syntaxe Previous: Place de la syntaxe

Ludovic TANGUY
Fri Dec 5 16:57:51 MET 1997