Thèses en cours :


Depuis 2018      Filip Miletić (en codirection avec A. Przewozny, axe Vast) : Usage des word embeddings pour le repérage des glissements de sens en anglais québécois
Financement : CDU

Thèses soutenues :


2020 Bénédicte Pierrejean : Qualitative Evaluation of Word Embeddings: Investigating the Instability in Neural-Based Models
Financement : CDU
2015      Nikola Tulechki : Natural language processing of incident and accident reports: application to risk management in civil aviation
Financement : convention CIFRE avec la société CFH
2013      Assaf Urieli : Robust French syntax analysis: reconciling statistical methods and linguistic knowledge in the Talismane toolkit
Financement : aucun
2009      Marion Laignelet : Analyse discursive pour le repérage automatique de segments obsolescents dans des documents encyclopédiques
Financement : convention CIFRE avec la société Initiales Publishing
(en co-direction avec Marie-Paule Péry-Woodley)

Mémoires de Master en Sciences du Langage :


2019 Alizé Auger (M1) : Vers une caractérisation des relations syntagmatiques
Mario Bravo Candel (M1) : Évaluation des similarités lexicales instables identifiées par analyse distributionnelle
Anastasia Larionova (M1) : Emplois temporels ou pragmatiques de "après"
Beatriz Martìnez Tornès (M2) : L'impact de la polysémie dans une tâche d'association lexicale
Julieta Mirata Missagh (M1) : Le réperage automatique de discussions terminologiques
2018 Mathilde Bacqué (M1) : Repérage automatique des mentions de terminologie : le cas des pages de discussion Wikipédia
Damien Gouteux (M1) : Les titres de document scientifiques : récurrences dans les syntagmes binominaux après un double-point
Beatriz Martinez-Tornes (M1) : Ressources lexicales pour le traitement de la polysémie
2017 Anouk Birski (M1) : Catégorisation automatique d'actes de communication : les fils de discussion des pages de discussion Wikipédia
Camille Rohrbacher (M1) : Segmentation thématique de titres de publications scientifiques dans le but de détecter des ruptures dans la carrière de chercheurs
2016 Laura Rivière (M1) : Évaluation de systèmes de TAL : le cas de la substitution lexicale
Céline Grauby (M1) : L'analyse des citations dans les publication scientifiques : analyse contrastive de l'autocitation
2015 Camille Mercier (M1) : Difficultés d'une tâche de substitution lexicale
2014 Nicolas Ribeiro (M2) : Visualisation interactive de similarité textuelle : intervention du Topic Modeling
Clément Thibert (M1) : Marqueurs de la fatigue et du stress dans les rapport d'incidents aériens: repérage automatique de facteurs humains pour l'amélioration du Retour d'EXpérience
2013 Emilie Merdy (M1) : Traitement automatique de rappels de souvenirs épisodiques
Nicolas Ribeiro (M1) : Visualisation interactive de similarité textuelle
2012 Céline Barès (M1) : Le typage et le repérage automatique de la subjectivité dans des rapports d'incidents et d'accidents aréonautiques
2011 Camille Bonrepaux (M1) : La reformulation de requête par les utilisateurs de moteurs de recherche sur le Web : étude de logs
Maud Colleter (M2) : Exploitation automatique des réponses d'un moteur de recherche pour la création d'une échelle de vitalité lexicale
Simon Leva (M2) : Caractérisation linguistique des requêtes des utilisateurs d'un moteur de recherche : vers une détection automatique des types de besoins d'information
2010 Simon Leva (M1) : Extraction d'un lexique bilingue français/tchèque à partir de corpus parallèles alignés
2009 Fanny Lalleman (M2) : Vers une échelle automatique d'importance des références bibliographiques en SHS (codir. avec MP. Péry-Woodley)
Maud Colléter (M1) : Vitalis, un programme pour mesurer la vitalité des lexèmes
Vanessa Néri (M1) : Étude des contextes d'apparitions humoristiques des déverbaux, dans le but de les classer automatiquement
Nikola Tulechki (M2) : Parallélisme et Discours : repérage de similarités surfaciques pour l'analyse automatique du discours (codir. avec MP. Péry-Woodley)
2008 Nikola Tulechki (M1) : Étude de la complexité syntaxique sur corpus : des principaux indices à la découverte de dimensions
Lionel Fontan (M2) : Analyse de corpus pour un enseignement de langue de spécialité : aide des outils de TAL (codir. avec MP. Péry-Woodley et N. Spanghero-Gaillard)
2007 Lolla Choucavy (M1) : Caractérisation des types de textes utilisés en chant choral 
Clémentine Adam (M1) : Traitement automatique de la coréférence pour une application de lexicométrie (codir. avec D. Bourigault)

Julien Bonneau (M2) : Apports linguistiques pour l'analyse de corpus en sciences humaines : exemples d'applications sur des entretiens semi-directifs (codir. avec C. Fabre)
2006 Coralie Bouffard (M1) : Exploitation automatique de productions langagières d'aphasiques : le répérage automatique des manifestations de surface du manque du mot (codir. avec JL Nespoulous)
2005 Marianne Vergez-Couret (Maîtrise) : Caractéristiques linguistiques des requêtes en recherche d'information

Claudia Ionescu-Ripoll (Maîtrise) : Le traitement automatique de la langue roumaine : le cas de la restauration automatique des signes diacritiques
2004 Herimanana Zafiharimalala (Maîtrise) : Classification automatique des noms de jeux et de jouets (codir. avec C. Pernet)

Aurélia Balesi (Maîtrise) : Etude comparative de l'expression de l'opinion selon les genres en vue d'un traitement automatique
2003
Sophie Nègre (Maîtrise) : Les schémas de cooccurrence Verbe/Déverbal : le cas des mots inconnus relevés par Webaffix (codir. avec N. Hathout)
2002 Yalina Alphonse (Maîtrise) : Le profilage des textes : apports de l'analyse distributionnelle
2001     
François Provansal (Maîtrise) : Etiquetage morphosyntaxique des unités polylexicales