Rencontres « Sémantique et Corpus » Ce que l'analyse de corpus apporte à la réflexion sur le sens |
Par "Extraction d'Information", on désigne usuellement un ensemble de techniques qui permettent d'extraire un type prédéfini d'information factuelle à partir d'un ensemble de documents homogènes. Le goulot d'étranglement majeur pour l'opérationnalisation de ces techniques est celui de l'acquisition de ces ressources (dictionnaires, classes sémantiques, patrons d'extraction). En s'appuyant sur des recherches en cours visant à concevoir un système d'exploration de la bibliographie en génomique, l'exposé présentera une approche d'aquisition de ressources à partir de corpus qui repose sur l'hypothèse d'une sémantique distributionnelle et l'utilisation de méthodes d'apprentissage automatique. |