Le département DIASI du CEA LIST propose un CDD de niveau post-doctoral
sur un projet de recherche.

Sujet : Génération Automatique de Scénarios à partir de Procédures
Écrites

Contexte
========

L'exploitation de la Réalité Augmentée pour la maintenance ainsi que
l'utilisation de robots dans ce type de tâches ou pour l'aide à la
personne nécessitent de disposer de modèles 3D de l'environnement et des
objets. Il faut aussi exprimer les scénarios de maintenance (RA) ou
d'action (robotique) en termes de ces modèles. Mais la réalisation
manuelle de tels modèles est extrêmement coûteuse. Or, les
documentations techniques et les scénarios de maintenance sont très
souvent décrits en langage naturel, et ce la plupart du temps avec un
langage contrôlé ou du moins très spécifique. De même, les scénarios
d'action des robots peuvent être énoncés à voix haute par les
utilisateurs. Il serait donc souhaitable de pouvoir convertir
(semi-)automatiquement l'ensemble de ces productions langagières en
éléments de modèles et en plans d'actions exprimés dans le langage
formel utilisé par l'application.

Les travaux proposés dans ce post-doc sont une collaboration entre trois
laboratoires du Département Intelligence Ambiante et Systèmes
Interactifs (DIASI) du CEA LIST. Ils consistent à exploiter les outils
d'analyse linguistique et sémantique développés au LVIC pour développer
de nouvelles méthodes de conversion du texte en modèles et les appliquer
aux besoins en RA et robotique des laboratoires LRI et LSI.

Etat de l'art et verrous technologiques
========
Même si des travaux existent sur ces sujets (Cf. références ci-dessous),
les verrous sont encore très nombreux. De nombreuses technologies qui
sont nécessaires dans le cadre de ce post-doc restent très
expérimentales : outils d'analyse sémantique (Word Sense Disambiguation,
Semantic Role Labeling,...) , exploitation de connaissances sur le
monde/pragmatique, lien sémantique lexicale / sémantique formelle,
interfaces homme-machine pour la mise a point des modèles (corrections,
évolutions).

Description des travaux
=======

Le post-doc recruté commencera son contrat par une rapide imprégnation
des technologies et des outils de Traitement Automatique des Langues du
LVIC, puis des technologies et outils cibles: modélisation 3D, RA,
robotique. Il poursuivra par une exploration approfondie de l'état de
l'art. Puis, il proposera un plan de travail incluant la réalisation de
deux prototypes et d'un plan d'évaluation.
Si le planning le permet et qu'une campagne d'évaluation adaptée existe,
il participera à cette campagne. Il devra en permanence rester en
contact avec des membres spécifiques des divers laboratoires, de façon à
s'assurer que son travail est bien cohérent avec les objectifs de
tous. Pour ce faire, des réunions de coordinations mensuelles seront
organisées avec des représentants des trois laboratoires.
Les prototypes développés devront permettre de convertir des documents
techniques en modèles et scénarios utilisables de façon
semi-automatique. Ils utiliseront les outils de traitement automatique
des langues et inclueront une interface graphique permettant de passer
du texte au modèle avec le moins de manipulations manuelle des données
possible.

Profil recherché
=======
Le candidat recherché est un docteur en informatique, spécialité
traitement automatique des langues ou technologies du Web sémantique
(ontologies, raisonnement). Il devrait posséder une expérience de la
réalisation d'interfaces graphiques, si possible en Qt. Une connaissance
de la modélisation 3D faciliterait le commencement du post-doc.

Lieu, durée et rémunération
=======
Le CDD se déroulera au sein du laboratoire LVIC, dans ses nouveaux
locaux de Nano'Innov à Palaiseau sur le plateau de Saclay en Région
Parisienne. La durée est de 12 mois et la rémunération selon les grilles
du CEA (environ 2200 ¤ net, variable selon le parcours)

Comment candidater
=======
Les candidatures sont à envoyer dès que possible et seront étudiées
jusqu'à ce que le poste soit pourvu.
Envoyer un CV et une lettre de motivation, ainsi que d'éventuelles
recommandations, par courrier électronique à

Mail: Gael.de-Chalendar@cea.fr
Tél.: +33 1 69 08 0150 

Références
=======
- Romaric Besançon, Gaël de Chalendar, Olivier Ferret, Faiza Gara,
  Olivier Mesnard, Meriama Laïb and Nasredine Semmar. LIMA : A
  Multilingual Framework for Linguistic Analysis and Linguistic
  Resources Development and Evaluation.  Proceedings of the Seventh
  conference on International Language Resources and Evaluation
  (LREC'10). May 2010.
- Eva Hanser. SceneMaker: Intelligent Multimodal Visualisation of
  Natural Language Scripts. Confirmation Report. June, 2009
- Minhua Ma. Automatic Conversion of Natural Language to 3D
  Animation. Thesis.  University of Ulster. July 2006
- Lee M. Seversky. Real-time Automatic 3D Scene Generation from Natural
  Language Voice and Text Descriptions. State University of New York at
  Binghamton
- Stéphane S. Somé and Xu Cheng. 2008. An approach for supporting
  system-level test scenarios generation from textual use cases. In
  Proceedings of the 2008 ACM symposium on Applied computing (SAC
  '08). ACM, New York, NY, USA, 724-729.

- Hans Svensson & Ola Åkerberg. Development and Integration of
  Linguistic Components for an Automatic Text-to-Scene Conversion
  System. Lund Institute of Technology. August 2002.

- Patrick Ye. Natural Language Understanding in Controlled Virtual
  Environments. PhD thesis. University of Melbourne. Melbourne,
  Australia. June 2009