Le département DIASI du CEA LIST propose un CDD de niveau post-doctoral sur un projet de recherche. Sujet : Génération Automatique de Scénarios à partir de Procédures Écrites Contexte ======== L'exploitation de la Réalité Augmentée pour la maintenance ainsi que l'utilisation de robots dans ce type de tâches ou pour l'aide à la personne nécessitent de disposer de modèles 3D de l'environnement et des objets. Il faut aussi exprimer les scénarios de maintenance (RA) ou d'action (robotique) en termes de ces modèles. Mais la réalisation manuelle de tels modèles est extrêmement coûteuse. Or, les documentations techniques et les scénarios de maintenance sont très souvent décrits en langage naturel, et ce la plupart du temps avec un langage contrôlé ou du moins très spécifique. De même, les scénarios d'action des robots peuvent être énoncés à voix haute par les utilisateurs. Il serait donc souhaitable de pouvoir convertir (semi-)automatiquement l'ensemble de ces productions langagières en éléments de modèles et en plans d'actions exprimés dans le langage formel utilisé par l'application. Les travaux proposés dans ce post-doc sont une collaboration entre trois laboratoires du Département Intelligence Ambiante et Systèmes Interactifs (DIASI) du CEA LIST. Ils consistent à exploiter les outils d'analyse linguistique et sémantique développés au LVIC pour développer de nouvelles méthodes de conversion du texte en modèles et les appliquer aux besoins en RA et robotique des laboratoires LRI et LSI. Etat de l'art et verrous technologiques ======== Même si des travaux existent sur ces sujets (Cf. références ci-dessous), les verrous sont encore très nombreux. De nombreuses technologies qui sont nécessaires dans le cadre de ce post-doc restent très expérimentales : outils d'analyse sémantique (Word Sense Disambiguation, Semantic Role Labeling,...) , exploitation de connaissances sur le monde/pragmatique, lien sémantique lexicale / sémantique formelle, interfaces homme-machine pour la mise a point des modèles (corrections, évolutions). Description des travaux ======= Le post-doc recruté commencera son contrat par une rapide imprégnation des technologies et des outils de Traitement Automatique des Langues du LVIC, puis des technologies et outils cibles: modélisation 3D, RA, robotique. Il poursuivra par une exploration approfondie de l'état de l'art. Puis, il proposera un plan de travail incluant la réalisation de deux prototypes et d'un plan d'évaluation. Si le planning le permet et qu'une campagne d'évaluation adaptée existe, il participera à cette campagne. Il devra en permanence rester en contact avec des membres spécifiques des divers laboratoires, de façon à s'assurer que son travail est bien cohérent avec les objectifs de tous. Pour ce faire, des réunions de coordinations mensuelles seront organisées avec des représentants des trois laboratoires. Les prototypes développés devront permettre de convertir des documents techniques en modèles et scénarios utilisables de façon semi-automatique. Ils utiliseront les outils de traitement automatique des langues et inclueront une interface graphique permettant de passer du texte au modèle avec le moins de manipulations manuelle des données possible. Profil recherché ======= Le candidat recherché est un docteur en informatique, spécialité traitement automatique des langues ou technologies du Web sémantique (ontologies, raisonnement). Il devrait posséder une expérience de la réalisation d'interfaces graphiques, si possible en Qt. Une connaissance de la modélisation 3D faciliterait le commencement du post-doc. Lieu, durée et rémunération ======= Le CDD se déroulera au sein du laboratoire LVIC, dans ses nouveaux locaux de Nano'Innov à Palaiseau sur le plateau de Saclay en Région Parisienne. La durée est de 12 mois et la rémunération selon les grilles du CEA (environ 2200 ¤ net, variable selon le parcours) Comment candidater ======= Les candidatures sont à envoyer dès que possible et seront étudiées jusqu'à ce que le poste soit pourvu. Envoyer un CV et une lettre de motivation, ainsi que d'éventuelles recommandations, par courrier électronique à Mail: Gael.de-Chalendar@cea.fr Tél.: +33 1 69 08 0150 Références ======= - Romaric Besançon, Gaël de Chalendar, Olivier Ferret, Faiza Gara, Olivier Mesnard, Meriama Laïb and Nasredine Semmar. LIMA : A Multilingual Framework for Linguistic Analysis and Linguistic Resources Development and Evaluation. Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC'10). May 2010. - Eva Hanser. SceneMaker: Intelligent Multimodal Visualisation of Natural Language Scripts. Confirmation Report. June, 2009 - Minhua Ma. Automatic Conversion of Natural Language to 3D Animation. Thesis. University of Ulster. July 2006 - Lee M. Seversky. Real-time Automatic 3D Scene Generation from Natural Language Voice and Text Descriptions. State University of New York at Binghamton - Stéphane S. Somé and Xu Cheng. 2008. An approach for supporting system-level test scenarios generation from textual use cases. In Proceedings of the 2008 ACM symposium on Applied computing (SAC '08). ACM, New York, NY, USA, 724-729. - Hans Svensson & Ola Åkerberg. Development and Integration of Linguistic Components for an Automatic Text-to-Scene Conversion System. Lund Institute of Technology. August 2002. - Patrick Ye. Natural Language Understanding in Controlled Virtual Environments. PhD thesis. University of Melbourne. Melbourne, Australia. June 2009