======================================== Stage Bac+5 : Analyse textuelle de scripts de films pour améliorer le repérage d'actions dans les vidéos de ces films ========================================= ========================================= Equipes, projet et lieu du stage : ========================================= Equipes : ALPAGE (UMR-I Univ Paris Diderot/INRIA et WILLOW (UMR CNRS/ENS/INRIA) Le stage sera déroulera en cotutelle par ALPAGE et WILLOW, dans le cadre du projet ERC VideoWorld : "Modeling, interpreting and manipulating digital video" Lieu : Le stagiaire sera basé à Alpage : 175 rue du chevaleret 75013 Paris ========================================= Sujet : ========================================= Un nombre énorme de vidéos est aujourd'hui disponible, en particulier sur Internet, qu'il s'agisse de vidéos informatives, éducatives, de divertissement ou autres. Ce nombre va croissant, et de ce fait l'accès intelligent à leur contenu devient un enjeu majeur. Un scénario de recherche au sein de vidéos peut par exemple se modéliser comme la recherche de certaines situations ou actions précises (faire du cheval, sortir d'un véhicule, prendre un repas ...). Pour automatiser cette tâche par des techniques d'apprentissage supervisé, un problème important est le fait qu'il est très fastidieux de construire des exemples d'apprentissage où les séquences de vidéos sont couplées à des actions précises. Une solution à ce problème est de construire automatiquement des exemples d'apprentissage en utilisant, lorsqu'ils existent, les textes associés aux vidéos. Ces textes sont en particulier disponibles pour un grand nombre de films, sous la forme de scripts de scenario. L'objet du stage est de construire un système intégré d'analyse de scripts (anglais) de films, en vue de permettre la classification automatique de descriptions de scènes de films en actions, parmi un ensemble prédéfini d'actions. Il s'agira de de coupler l'utilisation et l'adaptation de modules de traitement existants (reconnaissance d'entités nommées, résolution d'anaphores, tagging, parsing) à des modules spécifiques. Deux points (de recherche) attireront notre attention : d'une part l'utilisation du cadre FrameNet pour le repérage des actions, d'autre part les informations de factivité (cadre FactBank) pour savoir si une action s'est effectivement produite. Par exemple pour la description de scène suivante issue d'un script : " The servants move Chang's chair back. Before he goes, however, he turns to Conway and smiles at him. " Il s'agit de repérer les personnages "the servants", Chang, Conway; résoudre les références de "he" et "him"; repérer les actions "move chair", "turn", "smile" et leurs actants; et idéalement repérer que la mention de l'action de partir (to go) n'est pas réalisée ou pas encore réalisée. ========================================= Profil recherché : ========================================= Etudiant de niveau BAC +5, avec des connaissances en Traitement Automatique des Langues et en apprentissage automatique. Une autonomie en programmation est indispensable, ainsi qu'une bonne maîtrise de l'anglais (langue des textes à traiter). Des connaissances en linguistique seraient un plus apprécié. ========================================= Durée : 6 mois ========================================= Rémunération : selon profil ========================================= Envoyez CV et lettre de motivation à : contact : marie.candito@gmail.com