|
|
Par "Extraction d'Information", on désigne usuellement
un ensemble de techniques qui permettent d'extraire un type prédéfini
d'information factuelle à partir d'un ensemble de documents
homogènes. Le goulot d'étranglement majeur pour
l'opérationnalisation de ces techniques est celui de l'acquisition
de ces ressources (dictionnaires, classes sémantiques,
patrons d'extraction). En s'appuyant sur des recherches en cours
visant à concevoir un système d'exploration de la
bibliographie en génomique, l'exposé présentera
une approche d'aquisition de ressources à partir de corpus
qui repose sur l'hypothèse d'une sémantique distributionnelle
et l'utilisation de méthodes d'apprentissage automatique.
|
|