Offre d'emploi -------------- Un ingénieur / post-doc en informatique Profil ------ Traitement Automatique des Langues / Interactions Homme Machine Seraient appréciés : - maîtrise de la programmation en Python et/ou Java - connaissance en technologies Web Durée ----- 4 mois (à pourvoir au plus vite) à partir du 1er mars - Potentiellement extensible à 6 mois Salaire indicatif ----------------- 2350EUR brut. Employeur ------------- GREYC (CNRS UMR6072), laboratoire STIC Université de Caen Normandie / ENSI de Caen. Description -------------- La navigation visuelle sur internet permet d'accéder à la fois à une vue précoce et globale d'une page Web (stratégie dite d'écrémage ou skimming) puis de procéder à une recherche active et rapide d'informations spécifiques (stratégie dite de balayage ou scanning). Dans les deux cas la typographie et la disposition des éléments dans le document revêtent une importance capitale (titres, contenus proéminents, phrases spécialement positionnées). Les usagers non-voyants n'ont que peu l'usage de cette possibilité, bien qu'ils aient développé des stratégies palliatives telles que l'accélération du débit de la synthèse de la parole, le saut de titres en titres ou de liens hypertextes en liens hypertextes, la lecture des premières ou dernières phrases de tous les paragraphes. Néanmoins, la différence d'efficacité, en comparaison avec la navigation visuelle, reste significative. Nous nous intéressons dans ce travail à la conception de stratégies non linéaires de skimming et de scanning adaptées à une navigation non visuelle afin d'améliorer les possibilités d'accès à l'information pour les usagers non-voyants (lecture rapide ou en diagonale). L'idée que nous développons est de s'appuyer sur une transposition à l'oral du concept, très présent sur le Web, de représentation visuelle et interactive de mots-clefs : le nuage de mot (ou tag cloud). Si nous considérons visuellement une page Web, nous pouvons la définir comme un ensemble de blocs. Chacun est identifiable par un mot ou un ensemble de mots représentants son type/structure (métadonnées) ou son contenu (mots-clés). Si l'on efface tous les autres éléments de la page, ces « tags » peuvent être inscrits spatialement (couleur, taille, graisse, position...) selon l'importance typographique et la place occupée par le bloc dont ils proviennent. Ils forment finalement ainsi un effet visuel proche de celui d'un tag cloud. Étant donnée la structure arborescente d'une page Web, chacun des blocs peut récursivement contenir de nouveaux ensembles de blocs auquel on peut appliquer ce procédé d'extraction/effacement pour obtenir finalement un arbre de tag clouds représentant chacun un niveau de contenu. C'est une telle représentation de la structure logico-thématique de la page Web que nous souhaitons calculer automatiquement. En nous appuyant sur les spécificités de l'oral (type de voix, prosodie, spatialisation...), nous souhaitons générer avec un système de synthèse de la parole à partir de textes une version audio de cette représentation, que nous dénommons « tonnerre de mots » (ou tag thunder) : la concomitance visuelle devient sonore ! A l'instar de la mise en forme d'un document pour un voyant, le paysage sonore ainsi construit devra permettre à un non-voyant : - une perception précoce et globale de la page Web et de ses zones d'intérêt (skimming) - une navigation active et rapide d'une zone d'intérêt à une autre (scanning) - l'émergence de stratégies de lecture non visuelles innovantes L'objectif du travail sera de préparer le terrain de ce projet en réalisant un prototype fonctionnel et une évaluation de la faisabilité du dispositif. Contact ------- Adresser CV et lettre de motivation à : fabrice.maurel@unicaen.fr jean-marc.lecarpentier@unicaen.fr