Post-doctorat à l'Université Grenoble Alpes (LIDILEM) en linguistique et traitement automatique des corpus oraux Extraction de phrases préfabriquées de l'oral à partir de corpus oraux arborés (12 mois, début : 1/10/21) -- Contexte et objectifs - Ce postdoc aborde une thématique intéressant deux laboratoires de l'UGA : le LIDILEM (Laboratoire de Linguistique et de Didactique des Langues Étrangères et Maternelles, EA 609) et le LIG (Laboratoire d'Informatique de Grenoble, UMR 5217, équipe GETALP). Il traite une thématique émergente, l'étude des phrases préfabriquées de l'oral comme ça marche ! tu plaisantes ! comment dirais-je ? tu peux le dire. c'est OK . Ce thème n'a pas encore fait, pour le français, l'objet d'études sur de grands corpus, malgré son importance pour la didactique des langues étrangères ou le traitement automatique des langues. L'objectif du post-doc est double : il vise, d'une part, à extraire ces phrases à partir de grands corpus (corpus oraux transcrits et corpus de sous-titres) et, d'autre part, à effectuer un premier traitement linguistique des phrases les plus productives des corpus. Les tâches consisteront principalement à effectuer : a) un prétraitement du corpus oral (ORFEO-CEFC) et de sous-titres de films et à en effectuer une analyse syntaxique automatique en exploitant des standards comme UD ou SUD. b) l'extraction des phrases préfabriquées à partir d'amorces lexicales et de patterns identifiés comme les plus productifs c) un filtrage des résultats et une analyse linguistique d'ensemble des phrases préfabriquées les plus fréquentes. -- Champs de recherche - Linguistique, Traitement automatique des langues -- Mots clés - Phraséologie - Corpus oraux - Analyse syntaxique - Pragmatique - Interactions -- Groupe de recherche - Le postdoctorat sera intégré au Laboratoire LIDILEM EA 607 (Linguistique et Didactique des Langues Etrangères et Maternelles, [ https://lidilem.univ-grenoble-alpes.fr/ | https://lidilem.univ-grenoble-alpes.fr/ ] ) qui regroupe actuellement une soixantaine de membres permanents et environ 70 doctorants dans les domaines suivants : descriptions linguistiques, sociolinguistique, acquisition, constitution et exploitation de corpus, didactique des langues, traitement automatique des langues, étude des formes nouvelles d'interaction suscitées par les usages numériques. Le postdoctorat s'effectuera en collaboration étroite avec le LIG, équipe GETALP sur le site grenoblois ( [ http://lig-getalp.imag.fr/ | http://lig-getalp.imag.fr ] ). -- Profil du candidat - La personne recrutée aura un doctorat en sciences du langage et/ou en traitement automatique des langues, avec des compétences en sémantique et syntaxe, et une bonne maîtrise du langage de programmation Python et des techniques de base en TAL. La personne recrutée doit avoir de solides compétences en description sémantique et syntaxique et en linguistique de corpus. Elle doit également maîtriser les chaînes de traitement automatique des langues, avoir des connaissances de base en apprentissage automatique et être à l'aise dans l'écriture et l'adaptation de scripts en Python. Des connaissances en phraséologie et syntaxe de l'oral seront appréciées. Une compétence native (ou quasi-native) en français est requise. -- Processus de candidature - Envoyer un CV et une lettre de motivation à : Agnès Tutin (LIDILEM) : agnes.tutin@univ-grenoble-alpes.fr Olivier Kraif (LIDILEM) : olivier.kraif@univ-grenoble-alpes.fr Maximin Coavoux (LIG) : maximin.coavoux@univ-grenoble-alpes.fr Date-limite : 14 juillet 2021 Rémunération : autour de 2000 euros nets (selon expérience)