Offre de postdoc à France Telecom Orange Labs dans le domaine de la recherche d'information multilingue et cross-lingue (CLIR). Lieu : France Telecom Orange Labs à Lannion (Bretagne). Date : dès que possible. Durée : 12 mois. Sujet du postdoc : Approches hybrides de traitement des requêtes pour la recherche d'information cross-lingue Contexte de recherche : Certains choix techniques ou méthodologiques en recherche d'information multilingue n'ont pas encore atteint un niveau de consensus. Par exemple, il n'est pas trivial d'opter pour la traduction des requêtes ou la traduction des contenus. Toutefois, il nous semble d'ores et déjà acceptable que la traduction des contenus est plus optimale lorsque la quantité d'informations à indexer ainsi que le nombre de langues concernées ne sont pas très élevés. Dans le cas contraire, la traduction préalable de tous les contenus indexés dans toutes les langues peut poser de réels problèmes d'économie. En effet, une petite partie seulement des informations traduites pourrait être réellement exploitée. Activité du postdoc : Cette activité s'inscrit dans le cadre d'un projet de R&D dans le domaine de la recherche d'information multimédia et multilingue. Il est proposé d'explorer, mettre en oeuvre et évaluer une ou des méthodes hybrides pour le traitement des requêtes en vue d'une recherche cross-lingue. Contrairement à une traduction brute de la requête, qui peut échouer compte tenu de sa pauvreté syntaxique et contextuelle, ce travail consiste à explorer différentes approches dont la combinaison permettrait d'effectuer des pré-traitements ou des post-traitements moins systématiques et mieux réfléchis sur les requêtes : - Identification dans le requête des composants invariants, traduisibles, translitérables, etc. - Prise en compte de scores de confiance et post-édition de la traduction automatique. - Exploitation de ressources linguistiques : Wikipédia, entités nommées, lexiques multilingues, thésaurus, etc. - Utilisation de l'expansion de requêtes pour la compensation de la couverture lexicale issue de la traduction. - Choix et usage de techniques appropriées de traduction pour les différents composants de la requête. - Etc. Profil recherché : - Doctorat en informatique ou en linguistique, ayant été soutenu de préférence depuis moins d'un an. - Bonnes connaissances en TALN et des différentes approches en traduction automatique. - Connaissances en recherche d'information et en CLIR. - Maîtrise de Linux, Python ou Java, langage de script (bash), C++ serait un plus. - Langues : français et anglais (la connaissance d'autres langues serait la bienvenue). - Motivation pour la R&D dans un milieu industriel. Contact : Malek Boualem France Telecom Orange Labs Tél. 02 96 05 29 83 Email. malek.boualem [ à ] orange-ftgroup.com Merci de mettre comme objet du message : candidature au postdoc CLIR