Lydia-Mai Ho-Dac logo

Coordonnées
Bureau B515
Université de Toulouse-Le Mirail
Maison de la Recherche
5, allées Antonio Machado
F-31058 Toulouse Cedex 1
Tél : +33 (0)5 61 50 36 05
Fax : +33 (0)5 61 50 46 77
E-mail :
page web : http://hodaclm.free.fr
photo

Recherches

Docteur en Sciences du Langage depuis Novembre 2007, mes recherches se concentrent principalement sur l'étude de l'organisation du discours et sa signalisation. Ces sujets sont abordés sous trois perspectives en interaction :

  • La perspective linguistique qui vise à décrire les procédés linguistiques permettant d'organiser un discours i.e. de lui donner une texture et de signaler cette texture

    Texture can be defined as the process whereby meaning is channelled into a digestible current of discourse 'instead of spilling out formlessly in every possible direction' (Halliday 1994:311) [...](Martin 2001:35)

  • La perspective TAL qui se donne pour objectif la mise au point d'outils informatiques dédiés tout autant à l'analyse en linguistiques de corpus qu'à la mise en oeuvre d'applications (recherche d'information, résumé automatique, traduction assistée, traitement de l'information...)

    [The computer] gives us the ability to comprehend, and to account for, the contents of such corpora in a way which was not dreamed of in the pre-computational era of corpus' (Leech 1992:106)

  • La perspective cognitive qui cherche à décrire les processus et straté gies textuels utilisées lors de la production et interprétation de telle ou telle signalisation de la structure du discours

    Text and discourse processing are dynamic processes during which the reader or listener constructs a cognitive representation of the information in the text or discourse. Even though readers' and listeners' representations are not identical to the information they read and hear, texts and discourses contain many linguistic signals that guide comprehension. (Sanders & Gernsbacher 2004:79)

Recherche

Mots-Clefs Projets These & Mémoires Responsabilités

Domaines de recherches

  • Étude de l'organisation du discours et de sa signalisation, organisation du discours dans une approche descendante : du macro vers le local
  • Linguistiques de corpus : analyses quantitatives, annotation de corpus
  • Traitement automatique du langage : marquage automatique de traits liés à la signalisation de l'organisation du discours (PERL), constitution de corpus normés, ...

Mots-Clefs

Organisation du discours, Segmentation textuelle, linguistiques de corpus, approche data-driven, analyses quantitatives, traitements automatiques

Projets

Projets en cours

  • 2008-2011 The transformation of the relationship with information in multimedia communication (2008-2011) - projet ARC (UCL) - en collaboration avec L. Degand, A.-C. Simon, A. Küppers.
    Construction d'un corpus d'étude et mise en oeuvre d'analyses data-driven pour mesurer la variation de l'organisation discursive des textes de presse en ligne vs. presse traditionnelle papier.
  • 2008-2010 ANNODIS (ANNOtation DIScursive de corpus), projet ANR - Programme Sciences Humaines et Sociales Appel 2007 : "Corpus et outils de la recherche en sciences humaines et sociales". Responsable Marie-Paule Péry-Woodley, collaborateurs : CLLE-ERSS, Toulouse ; IRIT, Toulouse ; GREYC, Caen.
    Mise en oeuvre d'une campagne d'annotation des structures discursives dans des textes expositifs en vue de diffuser pour la communauté scientifique un corpus de textes longs normés (TEI-P5) et annotés discursivement. Corpus livré avec ses outils d'annotation et de navigation : l'interface GLOZZ.
  • 2006-en cours TELOC (Textes En Langue Occitane / Tèxtes En Lenga Occitana) : projet CLLE-ERSS, en partenariat avec le CNRTL, le CROM, CIEL d'ÒC, responsable Myriam Bras, collaborateurs Joan Thomas, Franck Sajous.
    Constitution de la base de donnée : mise au norme des textes selon la TEI-P5 et mise en place d'un formulaire de saisie pour la génération des headers (informations métatextuelles).

Projets achevés

  • 2008-2011 INTERMEDE(Services de santé de l'Institut de Recherche en Santé Publique, CLLE-ERSS : Toulouse)étude des interactions médecin-patient en médecine générale et inégalités sociales de santé.
    Extraction automatique de traits linguistiques à corréler avec des variables sociologiques.
  • 2008-2009 RHECITAS, projet TGE-ADONIS. Responsable Ludovic Tanguy de CLLE-ERSS, collaborations l'IRIT (Toulouse), l'INIST (Nancy), et Synapse Développement (Toulouse).
    Mise en oeuvre de traitements automatiques pour l'exploitation de structures discursives dans la mise en relation d'articles scientifiques à travers les "citations".
  • 2002-2005 VIZU (ERSS, LIMSI) : "Visualisation dynamique des Textes"
  • 2002-2005 GeoSem projet (ERSS, GREYC) : "Traitements sémantiques pour l’Information Géographique : textes, cartes, graphiques"
  • 2001-2005 ASTD (Adverbiauxspatiaux/temporels et Discours), projet ILF (ERSS, LATTICE)
  • 2000-2004 projet Cognitics (ERSS, IRIT), "Segmenter pour interpréter : marqueurs de segmentation et d'organisation des textes"

Thèse de Doctorant en Sciences du Langage

"La position initiale dans l'organisation du discours : une exploration en corpus"

Directeur de thèse : Marie-Paule Péry-Woodley

Financée dans le cadre du projet Cognitics intitulé "Segmenter pour interpréter", cette thèse propose une étude de l'organisation du discours basée sur une analyse en corpus effectuée grace à une méthodologie exploratoire et outillée.

Cette étude se concentre sur l'analyse du rôle discursif joué par les éléments situés en position initiale, de phrase mais également de paragraphe, de section. Cette étude se base sur une analyse quantitative d'un gros volume de données pour le domaine (700.000 mots), analyse rendue possible par l'adaptation des techniques des linguistiques de corpus à l'étude de l'organisation du discours: étiquetage automatique et systématique des éléments situés en position initiale, définition de variables, puis application de tests statistiques pour mesurer les distributions et les variations en position initiale.

D'un point de vue théorique, l'hypothèse générale est d'attribuer un rôle particulier à la position initiale concernant la signalisation de l'organisation du discours. Cette hypothè se est largement étayée par des travaux en linguistique cognitive qui soulignent l'importance de la position initiale en tant que position des premiers éléments perçus lors des processus de lecture, point de départ du message.

La distribution des éléments en position initiale nous informent sur le mode organisationnel d'un texte: à l'interface des composantes textuelle et idéationnelle.

Mémoires

Responsabilités scientifiques et animation de la recherche

  • Co-organisation de la conférence MAD2010, Mars 2010, Moissac, France
  • Membre du comité éditorial de la revue Discours(e)
  • Co-organisation des dernières journées de Grammaire Aérées à GA 06, Septembre 2006, Moissac, France
  • Création de pages web pour la conférence MAD2010 et le projet ANNODIS

Enseignements
(en tant que monitrice (2000-04), ATER (2005-06) et formatrice (2006-07)
(haut-top)

  • Communication (L1) : cours (avec exemple de dissertation) et synthèse
  • Syntaxe et Lexicologie (L1) supports
    • 1(Lexicologie et Syntaxe : bibliographie et exercices)
    • 2(Variation Lexicale) 
    • 3(syntaxe : cours et exercices) 
    • 4(syntaxe : cours)
    • 5(correction de l'exercice IV du support 2, sur la variation lexicale)
  • Phonétique, photnologie, morphologie (L1)
  • Les courants de la linguistique (L1)
  • Orthographe et analyse grammaticale (préparation aux concours d'orthophoniste et de professeur des écoles)

Publications(haut-top)

Liste des publications téléchargeable ici

Articles

Communications (avec actes - articles longs)

  • Küppers A. & Ho-Dac L-M. (2010) "Private State in Public Media: Subjectivity in French Traditional and Online News", 1st Workshop on Computational Approaches to Subjectivity and Sentiment Analysis (WASSA), ECAI 2010, Lisbon (Portugal) 18 Août 2010. [En ligne] URL : http://gplsi.dlsi.ua.es/congresos/wassa2010/?opc=6
  • Ho-Dac L-M., Péry-Woodley M-P. & Tanguy L. (2010) "Anatomie des structures énumératives", TALN 2010, Montréal, Québec, 19-23 juillet 2010. [En ligne] URL : http://www.iro.umontreal.ca/~felipe/TALN2010/Xml/Papers/all/taln2010_submission_26.pdf (voir les publications ANNODIS).
  • Ho-Dac L-M., Fabre C., Péry-Woodley M-P. & Rebeyrolle J. (2010) "On the signalling of multi-level discourse structures", MAD 2010 : Multidisciplinary Perspectives on Signalling Text Organisation, Moissac (France) 17-20 mars 2010. [En ligne] URL : http://w3.workshop-mad2010.univ-tlse2.fr/ (voir les publications ANNODIS).
  • Ho-Dac L-M., Fabre C., Péry-Woodley M-P. & Rebeyrolle J. (2009) "A top-down approach to discourse-level annotation". Corpus Linguistics 2009 (CL 2009). July 20-23, 2009, Liverpool, UK. (voir les publications ANNODIS).
  • Ho-Dac L-M., Fabre C., Péry-Woodley M.-P. & Rebeyrolle J. (2009) "Corpus annotation of macro discourse structures". 1st International conference on corpus linguistics (CILC-09). 7-9 May, 2009, University of Murcia. [En ligne] URL : www.um.es/lacell/aelinco/index.html (voir les publications ANNODIS).
  • Ho-Dac L-M. & Péry-Woodley M-P. (2008) "Méthodologie exploratoire outillée pour l'étude de l'organisation du discours",in Durand J. Habert B., Laks B. (éds.) Congrès Mondial de Linguistique Française - CMLF'08 , ISBN 978-2-7598-0358-3, Paris, 2008, Institut de Linguistique Française.
  • Fabre C., Rebeyrolle J. & Ho-Dac L.-M. (2008) "Examen du statut des syntagmes prépositionnels à la lumière de données issues de corpus annotés",in Durand J. Habert B., Laks B. (éds.) Congrès Mondial de Linguistique Française - CMLF'08 , ISBN 978-2-7598-0358-3, Paris, 2008, Institut de Linguistique Française.
  • Ho-Dac L-M. & Péry-Woodley M-P. (2008) "Temporal adverbials and discourse segmentation revisited", Linearisation and Segmentation in Discourse. Multidisciplinary Approaches to Discourse 2008 (MAD 08), fevrier 2008, Oslo, Norvège.
  • Ho-Dac L-M. (2007) "Exploring discourse organization through Theme Position", The 19th European Systemic Functional Linguistics Conference and Workshop (Data and Interpretation) 23rd - 25th July 2007, Saarbrücken, Germany (abstract).
  • Ho-Dac L-M. (2005) "Analyse quantitative du marquage de l'organisation discursive en position initiale", 38th annula conference SLE (Societas Linguistica Europea) : Formal, Functaional and Typological perspectives on discourse and grammar, Valencia(Spain), 7-10 sept 2005.
  • Ho-Dac L-M., Laignelet M. (2005) "Temporal Structure and Thematic Progression: A Case Study on French Corpora" , Symposium on the Exploration and Modelling of Meaning (SEM-05), Connectives, discourse framing and discourse structure: from corpus-based and experimental analyses to discourse theories, Biarritz (Basque Country, France) - Casino Bellevue, 14-15 nov 2005 , abstract.

Communications (sans actes)

Posters

Séminaires

Autres et liens(haut-top)

  • Musicienne (piano, guitare, voix, accordéon, bouinage sonore, et tout ce qui peut faire du bruit)
  • Premiers pas musicaux punkeste avec les BoumBomozes (inédit de rupture (mp3)
  • Joue (de la musique, des marionnettes et de soi-même) dans "les poupées barbares"
  • De bien belles paroles dites par Higelin lors d'une AG des intermlittents luttant pour leur statut. Un discours sur la condition d'artiste en ces temps difficiles mais cependant libres (mp3)
  • Compagne du célèbre inventeur des pistolets à images et du VideoGun http://lesmachinesaimages.free.fr/
  • Amie d'une certaine cuisinière à votre service : les p'tits plats d'Eva, et d'une couturière : oriane