Thèses en cours :


Depuis 2024      Iuliia Arsenteva : Détection de marqueurs psychologiques et linguistiques dans des petits corpus
Financement : convention CIFRE avec Orange Innovation
Depuis 2021      Claire Ibarboure (en codirection avec F. Amadieu) : Dynamique des parcours de recherche d’information : représentation et analyse des sessions utilisateurs avec des modèles sémantiques vectoriels
Financement : CDU
Mariame Maarouf : Contribution du TAL à la résolution des problèmes techniques en phase de production et d'exploitation intelligente de systèmes de lancement
Financement : bourse de thèse CNES / Meetsys

Thèses soutenues :


2022 Filip Miletić (en codirection avec A. Przewozny-Desriaux) : An investigation into contact-induced semantic shifts in Quebec English : conciliating corpus-based vector models and variationist sociolinguistic inquiry
Financement : CDU
2020 Bénédicte Pierrejean : Qualitative Evaluation of Word Embeddings: Investigating the Instability in Neural-Based Models
Financement : CDU
2015      Nikola Tulechki : Natural language processing of incident and accident reports: application to risk management in civil aviation
Financement : convention CIFRE avec la société CFH (Conseils en Facteurs Humains)
2013      Assaf Urieli : Robust French syntax analysis: reconciling statistical methods and linguistic knowledge in the Talismane toolkit
Financement : aucun
2009      Marion Laignelet (en co-direction avec M.-P. Péry-Woodley) : Analyse discursive pour le repérage automatique de segments obsolescents dans des documents encyclopédiques
Financement : convention CIFRE avec la société Initiales Publishing

Mémoires de Master en Sciences du Langage :


2023Daniela Cadenas León (M1) : Détection automatique d'erreurs dans les amorces des questionnaires à choix multiples
Shaad Cassam Sulliman (M1) : Classification et analyse de l’expression des problèmes techniques
Angélo Mendonca Manhoso (M1) : Mesure et étude des écarts sémantiques dans les niveaux de représentation des topics TREC : Caractérisation des stratégies de formulation utilisées
Vladana Perlić (M1) : Reformulation des requêtes : changement de sens par des mots ajoutés, supprimés et modifiés dans des requêtes successives
2022Andréa Blivet (M1) : Identification et catégorisation du code-switching anglais-français dans les tweets
Wenxiang Zhou (M1) : Détection automatique des faux-amis dans un corpus de sous-titres
2021Morgane Aurambout (M1) : Repérage d’occurrences de glissements sémantiques chez les faux-amis français-anglais dans les tweets
Olivia Henry (M1) : Caractérisation des interactions dans les espaces de discussion de la Wikipédia
Claire Ibarboure (M2) : Qualification sémantique des parcours de recherche sur le Web en utilisant des modèles vectoriels
Alexis Robert (M1) : Vers un thésaurus du TAL : Structure à partir des mots-clés du corpus TALN
Mathilde Simounet (M2) : Prédiction automatique d'associations lexicales : comparaison de données expérimentales et naturelles
2020 Alice Adnot-Albinet (M1) : Forme et contenu des titres de figures et tableaux dans les articles scientifiques - Étude du corpus de la conférence TALN
Claire Ibarboure (M1) : Caractérisation des sessions de recherche sur le Web : origine des mots ajoutés lors des reforumulations
Marie Joyau (M1) : Caractéristiques et enjeux des mots-clés d’auteurs : pour une terminologie du TAL
Jade Moillic (M1) : Catégorisation des titres d’articles scientifiques du type “X : Y”
Mathilde Simounet (M1) : Patrons lexico-syntaxiques pour l’identification de la relation sémantique entre deux mots
2019 Alizé Auger (M1) : Vers une caractérisation des relations syntagmatiques
Mario Bravo Candel (M1) : Évaluation des similarités lexicales instables identifiées par analyse distributionnelle
Anastasia Larionova (M1) : Emplois temporels ou pragmatiques de "après"
Beatriz Martìnez Tornès (M2) : L'impact de la polysémie dans une tâche d'association lexicale
Julieta Mirata Missagh (M1) : Le réperage automatique de discussions terminologiques
2018 Mathilde Bacqué (M1) : Repérage automatique des mentions de terminologie : le cas des pages de discussion Wikipédia
Damien Gouteux (M1) : Les titres de document scientifiques : récurrences dans les syntagmes binominaux après un double-point
Beatriz Martinez-Tornes (M1) : Ressources lexicales pour le traitement de la polysémie
2017 Anouk Birski (M1) : Catégorisation automatique d'actes de communication : les fils de discussion des pages de discussion Wikipédia
Camille Rohrbacher (M1) : Segmentation thématique de titres de publications scientifiques dans le but de détecter des ruptures dans la carrière de chercheurs
2016 Laura Rivière (M1) : Évaluation de systèmes de TAL : le cas de la substitution lexicale
Céline Grauby (M1) : L'analyse des citations dans les publication scientifiques : analyse contrastive de l'autocitation
2015 Camille Mercier (M1) : Difficultés d'une tâche de substitution lexicale
2014 Nicolas Ribeiro (M2) : Visualisation interactive de similarité textuelle : intervention du Topic Modeling
Clément Thibert (M1) : Marqueurs de la fatigue et du stress dans les rapport d'incidents aériens: repérage automatique de facteurs humains pour l'amélioration du Retour d'EXpérience
2013 Emilie Merdy (M1) : Traitement automatique de rappels de souvenirs épisodiques
Nicolas Ribeiro (M1) : Visualisation interactive de similarité textuelle
2012 Céline Barès (M1) : Le typage et le repérage automatique de la subjectivité dans des rapports d'incidents et d'accidents aréonautiques
2011 Camille Bonrepaux (M1) : La reformulation de requête par les utilisateurs de moteurs de recherche sur le Web : étude de logs
Maud Colleter (M2) : Exploitation automatique des réponses d'un moteur de recherche pour la création d'une échelle de vitalité lexicale
Simon Leva (M2) : Caractérisation linguistique des requêtes des utilisateurs d'un moteur de recherche : vers une détection automatique des types de besoins d'information
2010 Simon Leva (M1) : Extraction d'un lexique bilingue français/tchèque à partir de corpus parallèles alignés
2009 Fanny Lalleman (M2) : Vers une échelle automatique d'importance des références bibliographiques en SHS (codir. avec MP. Péry-Woodley)
Maud Colléter (M1) : Vitalis, un programme pour mesurer la vitalité des lexèmes
Vanessa Néri (M1) : Étude des contextes d'apparitions humoristiques des déverbaux, dans le but de les classer automatiquement
Nikola Tulechki (M2) : Parallélisme et Discours : repérage de similarités surfaciques pour l'analyse automatique du discours (codir. avec MP. Péry-Woodley)
2008 Nikola Tulechki (M1) : Étude de la complexité syntaxique sur corpus : des principaux indices à la découverte de dimensions
Lionel Fontan (M2) : Analyse de corpus pour un enseignement de langue de spécialité : aide des outils de TAL (codir. avec MP. Péry-Woodley et N. Spanghero-Gaillard)
2007 Lolla Choucavy (M1) : Caractérisation des types de textes utilisés en chant choral 
Clémentine Adam (M1) : Traitement automatique de la coréférence pour une application de lexicométrie (codir. avec D. Bourigault)

Julien Bonneau (M2) : Apports linguistiques pour l'analyse de corpus en sciences humaines : exemples d'applications sur des entretiens semi-directifs (codir. avec C. Fabre)
2006 Coralie Bouffard (M1) : Exploitation automatique de productions langagières d'aphasiques : le répérage automatique des manifestations de surface du manque du mot (codir. avec JL Nespoulous)
2005 Marianne Vergez-Couret (Maîtrise) : Caractéristiques linguistiques des requêtes en recherche d'information

Claudia Ionescu-Ripoll (Maîtrise) : Le traitement automatique de la langue roumaine : le cas de la restauration automatique des signes diacritiques
2004 Herimanana Zafiharimalala (Maîtrise) : Classification automatique des noms de jeux et de jouets (codir. avec C. Pernet)

Aurélia Balesi (Maîtrise) : Etude comparative de l'expression de l'opinion selon les genres en vue d'un traitement automatique
2003
Sophie Nègre (Maîtrise) : Les schémas de cooccurrence Verbe/Déverbal : le cas des mots inconnus relevés par Webaffix (codir. avec N. Hathout)
2002 Yalina Alphonse (Maîtrise) : Le profilage des textes : apports de l'analyse distributionnelle
2001     
François Provansal (Maîtrise) : Etiquetage morphosyntaxique des unités polylexicales