Le Centre de Recherche sur la Cognition et L'apprentissage (UMR 7695 du CNRS et de l'Université de Poitiers) propose un contrat d'ingénieur d'études dans le cadre d'un projet financé par l'ANR (Agence Nationale de la Recherche, France) Pro-TEXT : Les processus de textualisation : modélisations linguistiques, psycholinguistiques et d'apprentissage automatique - Date limite des candidatures : au plus tard le 25 septembre 2019 - audition des candidat.e.s retenu.e.s début octobre. - Durée : 12 mois, à partir de début Novembre. - Rémunération : environ 3000 euros brut - Profil recherché Sous la direction de Thierry Olive (Directeur de Recherche au CNRS), l'ingénieur.e d'étude devra : 1. Se familiariser avec la littérature scientifique sur l'étude de la production écrite, et en particulier de l'analyse en temps réel de la production, des jets textuels, et des mesures de la dynamique textuelle. 2. Participer à de la collecte de données 3. Traiter des enregistrements d'écriture via des données de keylogging (inputlog, scriptlog...) 4. Développer des scripts d'analyses 4. Effectuer des analyses statistiques L'ingénieur.e recruté·e devra être titulaire d'un Master en psychologie (psychologie cognitive, psycholinguistique) ou d'un Master en Linguistique (mais possédant de très bonnes bases en psycholinguistique de l'écrit). Des compétences en statistiques sont nécessaires. Enfin, des compétences en programmation seront bienvenues. Une connaissance du Français est nécessaire pour travailler sur la catégorisation des jets textuels. Pour toutes questions sur le projet, les candidat·e·s sont invité·e·s à contacter directement le porteur de projet par courriel (voir ci-dessous). Candidature Pièces à joindre au dossier, dans un fichier PDF unique : - un CV - une lettre de motivation. Cette lettre devra expliquer en quoi les compétences des candidat.e.s sont adaptées au travail demandé. - la copie du relevé de notes de Master 2 et la copie du diplôme de Master 2 (si disponible) - un résumé des travaux antérieurs (Master 1 et Master 2) Les candidat.e.s pré-sélectionné.e.s seront convoqué.e.s pour présenter leur candidature. Des informations plus précises sur les modalités de l'audition seront envoyés aux candidat.e.s pré-sélectionné.e.s. Dossier à adresser à thierry.olive@univ-poitiers.fr - Description du projet Ce projet de recherche vise à analyser le processus de textualisation, c'est-à-dire la façon dont un texte est construit progressivement. Les textes sont produits sous des contraintes complexes qu'il est maintenant possible de capturer avec un enregistrement en temps réel du processus d'écriture en utilisant des logiciels de keylogging. L'enregistrement en temps réel du processus d'écriture produit des données temporelles (par exemple, une longueur de pause), des données linguistiques (des séquences linguistiques produites de manière continue entre deux pauses, c'est-à-dire des jets textuels, Cislaru & Olive 2018) et des données topologiques indiquant l'emplacement des opérations textuelles dans le texte. Les principaux objets du projet sont les jets textuels d'écriture, qui sont des segments de texte produits entre deux pauses, comme par exemple dans [pause] une cousine qui [pause] peut venir partager du temps avec elle pendant [pause] le [pause] w [pause] eek [pause] - [pause] end. [pause] Le projet Pro-TEXT développe des méthodes linguistiques et psycholinguistiques et des outils d'apprentissage automatique afin de mieux comprendre la relation entre les régularités de la performance linguistique écrite et les contraintes cognitives et contextuelles. Le projet s'appuie sur un corpus de chaînes de langage (les jets textuels) et de pauses et comprend plus de 30 000 jets. Le travail qui sera fait pour le projet Pro-TEXT vise à mettre à jour la dynamique du processus de textualisation en modélisant les relations entre les indices temporels des processus cognitifs (tels que les pauses) et la nature des jets textuels en français et en traduction français -anglais. Nous soutenons que la façon dont les séquences linguistiques s'articulent linéairement au cours du processus de textualisation traduit la prise en compte des différentes contraintes sous-jacentes aux performances langagières. Plus spécifiquement, il s'agit de : i) Mettre à jour les chaînes linguistiques choisies par les rédacteurs pour construire leurs textes et les liens par lesquels ils sont interconnectés ; ii) Identifier les types de séquences constituant le matériel linguistique pour la textualisation ; iii) Fixer les règles et les régularités qui sous-tendent leur organisation dans un texte valide du point de vue formel et sémantique et les stratégies combinatoires utilisées par les rédacteurs dans divers contextes et genres de textes ; iv) Interpréter les pauses de production et les jets textuels re en identifiant les processus cognitifs sous-jacents et la manière dont les variations des demandes cognitives affectent ces pauses et jets, ainsi que les formes et fonctions linguistiques des jets. Le candidat sélectionné devra traiter les fichiers log d'écriture afin de rassembler les paramètres dynamiques des paramètres de pause et de jets (longueur, durée) dans le but d'examiner comment la pause précédant un jet textuel varient avec différents seuils et différentes contraintes cognitives. Le candidat sélectionné sera responsable du traitement des données des fichiers log, de l'extraction des pauses et des jets après avoir appliqué les différents critères de seuils de pause. Relier les pauses et les jets textuels est d'une importance cruciale pour mieux comprendre en quoi l'adoption d'un seuil de pause particulier peut affecter les caractéristiques des jets textuels. En partant de l'hypothèse selon laquelle des facteurs cognitifs et linguistiques ont une incidence sur la durée de la pause et, par conséquent, sur les jets qui leur succèdent, le candidat sélectionné appliquera des modèles statistiques sur les caractéristiques des pauses et des jets textuels. Nous supposons en particulier que différentes dimensions des pauses et des jets peuvent être regroupées, chaque groupe se référant à un ensemble de processus cognitif d'écriture. Inversement, nous examinerons comment la longueur d'une pause peut déterminer le jet suivant.