--------------------------------------------------------- PROPOSITION DE STAGE DE MASTER RECHERCHE REMUNERE --------------------------------------------------------- Ce stage de Master se déroulera au sein du PRES Sorbonne Paris Cité entre le LIPN (http://www-lipn.univ-paris13.fr/), dans l'équipe «Représentation des Connaissances et Langage Naturel» (RCLN) et le LATTICE (http://www.lattice.cnrs.fr/). Ce stage est rémunéré grâce au soutien du laboratoire d'excellence "Empirical Foundations of Linguistics" (labex EFL, http://www.labex-efl.org/). Il fait partie d'un projet plus large sur la découverte de patrons lexico-grammaticaux, mené en commun entre le LIPN et le LATTICE dans le cadre du labex EFL (axe «Analyse sémantique computationnelle » (http://www.labex-efl.org/?q=fr/recherche/axe5). Le sujet est décrit ci-dessous. Profil recherché : étudiant Master Recherche en TAL ou en informatique (avec compétences en TAL). Les candidats doivent envoyer leur candidature (CV, Lettre de motivation, relevés de notes,...) le plus rapidement possible par mail à Thierry.Charnois@lipn.univ-paris13.fr Ce stage sera déroulera à Paris, et sera co-encadré par Thierry Poibeau (LATTICE) et Thierry Charnois (LIPN), Dominique Legallois (Crisco, université de Caen) participera également à l'encadrement. *SUJET : Caractérisation des genres discursifs par la méthode des motifs séquentiels* L'objectif de ce stage de Master 2 est l'analyse d'un genre discursif particulier, le roman policier. Le point principal consistera à identifier les motifs séquentiels spécifiques de ce genreen le comparantau genre romanesque dit "sérieux". Les motifs sont des patrons lexico-grammaticaux, plus abstraits que les segments répétés ou n-grams. Ils sont de taille variable, et peuvent comporter des "gaps" entre les différents éléments. Ils sont extraits de façon non supervisée. L'approche défendue, en privilégiant des unités syntagmatiques, se veut complémentaire de laperspective morpho-syntaxique (Malrieu et Rastier 2001) qui reste, dans le domaine de la caractérisation générique, la méthode traditionnellement adoptée après Biber (1991). L'extraction des motifs sera réalisée à partir de l'outil SDMC -- http://sdmc.greyc.fr -- (des fonctionnalités supplémentaires pourront être proposées et implémentées durant le stage) ; les principales réflexions du stagiaire porteront sur les différences de granularité des motifs, sur la pertinence de certaines annotations sémantiques possibles, ou sur la pertinence d'une catégorisation morpho-syntaxiques plus fines des unités. Malrieu D. et Rastier F. (2001) Genres et variations morphosyntaxiques, /Traitements automatiques du langage/, 42, 2, pp. 547-577. Biber, D. (1991). /Variation Across Speech and Writing/. Cambridge University Press, Cambridge, 1991. Longrée D. et Mellet S. (2013). « Le motif : une unité phraséologique englobante ? Étendre le champ de la phraséologie de la langue au discours », /Langages/189 (D. Legallois & A. Tutin, coord.), p.68-80 Quiniou S. ; P. Cellier ; T. Charnois et D. Legallois (2012). « What About Sequential Data Mining Techniques to Identify Linguistic Patterns for Stylistics? ». Actes de la conférence CICLING. Springer.