Sujet du stage M2 (5-6 mois) : Un langage contrôle pour les Instructions Nautiques du SHOM Responsables : Yannis Haralambous (Télécom Bretagne / Lab-STICC), Georges Dubois (SHOM) Laboratoire d'accueil : Télécom Bretagne http://www.telecom-bretagne.eu et Lab-STICC, pôle CID, équipe DECIDE http://www.lab-sticc.fr/ Les langages contrôlés sont des langages artificiels utilisant un sous-ensemble du vocabulaire, des formes morphologiques, des constructions grammaticales et des interprétations sémantiques d’une langue naturelle (dans notre cas : le français). En quelque sorte ils constituent le pont entre les langages formels et les langues naturelles. De ce fait, ils remplissent la fonction de communication du médium texte tout en étant rigoureux et analysables par la machine sans ambiguïté. En particulier, ils peuvent être utilisés pour faciliter l’alimentation de bases de connaissances, dans le cadre d’une interface homme-machine au moment de la saisie du texte. Le Service Hydrographique et Océanographique de la Marine (SHOM) publie depuis plusieurs années les Instructions Nautiques, un recueil de renseignements généraux, nautiques et réglementaires, destinés aux navigateurs. Ces informations complètent les cartes marines. Elles sont obligatoires à bord des navires de commerce et de pêche. L’Organisation Hydrographique Internationale (OHI) a publié des normes spécifiant l’échange de données liées à la navigation et notamment un modèle universel de données hydrographiques (norme S-100, janvier 2010). Le but de ce stage est d’élaborer un langage contrôlé qui couvre les besoins des Instructions Nautiques et qui permette l’alimentation de bases de connaissances conformes à la norme S-100. Comment faire évoluer le langage selon les évolutions des ontologies concernées et l'alimentation de la base de connaissances ? Dans le contexte d’une thèse CIFRE, deux applications seront envisagées : (a) une interface homme-machine qui analyse en temps réel le texte saisi par l’opérateur des Instructions Nautiques et qui valide son appartenance au langage contrôlé ; (b) un outil semi-automatique de traduction des documents existants dans le langage contrôlé. Ce stage se concentrera sur la faisabilité d’un langage contrôlé qui satisfasse les deux contraintes : exploitation optimale du contenu traditionnel des Instructions Nautiques et adéquation avec la norme S-100. Un prototype de langage sera élaboré, accompagné des algorithmes d’extraction de connaissances et d’alimentation d’une base de connaissance conforme à la norme S-100. Ce stage est proposé en collaboration avec le SHOM. Pour candidater : envoyer LM+CV à yannis.haralambous [ à ] telecom-bretagne.eu