Offre de stage de M2 : « Langage enfantin » : aide rédactionnelle pour le récit d'événements à des enfants Stage financé par le projet ANR TREMoLo et en partenariat avec Libération. -------------- Contexte -------------- Le projet TREMoLo étudie l'emploi de différents registres dans la langue française et vise à développer des méthodes automatiques de transformation de textes d'un registre vers un autre. Un des registres étudiés est celui qui correspond au « langage enfantin ». L'une des visées applicatives envisagées concernant l'analyse de ce registre est celle du récit d'événements à destination des enfants. La maîtrise de plus en plus précoce par les enfants des outils informatiques et d'Internet impulse en effet un intérêt grandissant sur la thématique STIC pour les enfants, notamment au travers de questions liées à l'adéquation de contenus textuels à des enfants (Eickhoff et coll., 2010) ou à l'adaptation aux enfants du processus de recherche d'information, y compris sur les aspects liés au filtrage ou au réordonnancement de résultats (Gossen et Nürnberger, 2013). Mots-clés : Registres de langue, langage enfantin, récit d'évènements, Traitement automatique des langues (TAL), Fouille de données -------------- Description du stage --------------- L'objectif de ce stage est tout d'abord de répertorier les descripteurs, c'est-à-dire les traits ou phénomènes linguistiques - sur les plans morphologique, syntaxique, sémantique et discursif - qui permettent de caractériser un langage approprié pour s'adresser à des enfants de 7 à 10 ans et donc de clarifier les différences entre la langue parlée par les adultes et celle produite par des enfants de cette tranche d'âge. Il s'agira ensuite de caractériser finement ces traits au regard de la tâche de mise en récit d'un événement (et donc en mettant l'accent sur des descripteurs de types temps verbaux, connecteurs temporels, cadres temporels discursifs, etc.). En linguistique, les travaux classiques sur le langage adressé à l'enfant (Saint-Georges et coll., 2013) s'intéressent à la manière dont l'adulte adapte sa langue en s'adressant à des enfants de moins de 3 ans. Ces travaux portent beaucoup sur les formes sonores (phonèmes et intonation) et sur la notion d'interaction, sachant que les formes produites sont très différentes d'un adulte à l'autre. On sait en outre que les productions de l'enfant s'inspirent énormément de celles de l'adulte (Tomasello, 2003) mais on ne sait pas comment l'adulte pourrait s'adapter à l'enfant plus âgé. Or l'enfant de 7 ans est encore en plein développement langagier, notamment au niveau des formes verbales encore peu fréquentes, des connecteurs, de l'accord temporel entre énoncés. L'enfant de 7 ans n'a pas encore fini sa maturation cérébrale, en particulier en terme de mémoire et d'attention, et ceci a des conséquences sur son langage et la manière dont il peut par exemple raconter une histoire (Gathercole, 1999). Des étapes développementales vis-à-vis des modes linguistiques de référence au temps ont quant à elles été clairement mises au jour dans des travaux comme Tartas (2001) ou Vion et coll. (1999). Dans une moindre mesure, le stage a également pour objectif d'identifier, parmi les nombreux outils existants en TAL, ceux permettant l'annotation automatique de textes en français pour les différents descripteurs retenus au fil du stage. La fiabilité des outils pourra être étudiée et prise en compte pour leur sélection mais il ne s'agit pas ici de développer de nouveaux outils. Le support d'étude se fera en partie au regard de productions journalistiques destinées à des enfants dans le cadre d'un partenariat avec le journal Le P'tit Libé de Libération. Le travail inclura donc des échanges avec des journalistes de leur rédaction. --------------- Profil souhaité --------------- - Formation en cours : Master 2 en Linguistique ou linguistique informatique. - Curiosité et capacité d'explorer de nouveaux domaines en linguistique. - Des connaissances en TAL seront un plus, mais ne sont aucunement prérequises. Un soutien sera assuré par les encadrants an cas d'absence de connaissances en TAL. Du reste, le sujet sera adapté en fonction du niveau et des types de compétences en TAL du (de la) candidat(e). ----------------- Conditions ----------------- Contrat : stage conventionné 6 mois rémunéré. Début : février, mars ou avril 2018. Lieu : laboratoire MoDyCo (site : Université de Paris Nanterre) ou laboratoire IRISA (site : Université de Rennes 1) Encadrants : Delphine Battistelli (MoDyCo), Gwénolé Lecorvé (IRISA) Selon les résultats du stage, une poursuite en thèse pourrait être envisagée. Merci d'envoyer votre candidature aux deux adresses suivantes : delphine.battistelli@parisnanterre.fr gwenole.lecorve@irisa.fr Documents souhaités : CV, lettre de motivation, relevés de notes M1 et M2. ----------------- Bibliographie indicative ----------------- De Belder & Moens (2010). Text simplification for children. In Proc. of the SIGIR worksh. on accessible search systems. https://lirias.kuleuven.be/bitstream/123456789/276005/1/beldersigir-as.pdf Eickhoff, Serdyukov & de Vries (2010). Web page classification on child suitability. In Proc. of the ACM international conference on Information and knowledge management. http://dmirlab.tudelft.nl/sites/default/files/cikm331s-eickhoff.pdf Gathercole (1999). Cognitive approaches to the development of short-term memory. Trends in Cognitive Sciences. https://faculty.biu.ac.il/~armonls/924/NWR/gathercole%2520(1999).pdf Gossen & Nürnberger (2013). Specifics of information retrieval for young users: A survey. Information Processing & Management. http://wwwiti.cs.uni-magdeburg.de/iti_dke/Pdf/GossenIPM.pdf Saint-Georges, Chetouani, Cassel, Apicella, Mahdhaoui, Muratori, Laznik, Cohen (2013). Motherese in Interaction: At the Cross-Road of Emotion and Cognition? (A Systematic Review). PLoS ONE. https://pdfs.semanticscholar.org/a37f/8fc857d4e7c435e6d645bc3a37ddd517c308.pdf Tartas (2010). Le développement de notions temporelles par l'enfant, Développements. https://www.cairn.info/article.php?ID_ARTICLE=DEVEL_004_0017 Tomasello (2003), Constructing a language, a usage-based theory of language acquisition. http://journals.lww.com/jonmd/Citation/2005/06000/Constructing_a_Language__A_Usage_Based_Theory_of.12.aspx Vion & Colas (1999). L'emploi des connecteurs en français : contraintes cognitives et développement des compétences narratives (le cas de la narration de séquences arbitraires d'événements). Prof. of Conference of the International Association for the Study of Child Language. https://hal.archives-ouvertes.fr/hal-00241527/document