Alternance 2018 / 2019 INGÉNIERIE LINGUISTIQUE ÉVALUATION D'OUTILS TEXT MINING DURÉE : 1 an Contexte: La R&D d'EDF (2000 chercheurs) a pour missions principales de contribuer à l'amélioration de la performance des unités opérationnelles du groupe EDF, d'identifier et de préparer les relais de croissance à moyen et long termes. Dans ce cadre, le département Innovation Commerciale Analyse des Marchés et de leur Environnement (ICAME) est un département pluridisciplinaire (sciences de l'ingénieur, sciences humaines et sociales) qui fournit un appui à l'élaboration et au portage des offres, des services et des outils de relation Client aux Directions opérationnelles du groupe EDF. Au sein de ce département , le poste sera rattaché au groupe «Statistiques et Outils d'Aide à la Décision » (SOAD) qui compte une vingtaine d'ingénieurs chercheurs spécialisés en data mining, informatique décisionnelle et data science ayant pour mission de construire et mettre en oeuvre les méthodes d'analyse, de fouille et d'enrichissement de données volumineuses d'origines multiples, structurées ou complexes. En effet, le volume des données numériques textuelles, disponibles sur l'Internet (forums, twitters etc.) ou relatives à des contacts client (enquêtes, centre d'appel etc.), augmente chaque année à un rythme exponentiel et l'analyse de ces informations, structurées ou non, est, aujourd'hui, un impératif stratégique pour une entreprise telle qu'EDF. Dans ce cadre, et dans l'objectif de toujours mieux connaître les besoins de ses clients, l'exploitation de ces documents implique l'utilisation de méthodes et d'outils adaptés. Au coeur de ces problématiques les outils de Text Mining sont de plus en plus nombreux et performants, ainsi nous souhaitons étudier les principaux outils évoluant sur le marché aujourd'hui. Contenu de la mission : Depuis 2003, les données textuelles sont essentiellement traitées à la R&D via des solutions Text Mining propriétaires et open-source (XIP de Xerox, ScikitLearn de python etc.). Ce choix fait suite à différentes campagnes de veille sur les outils de Text Mining open source et propriétaires (Gate, NLTK, Proxem etc. ...). Un protocole de test d'outils de Text Mining avait été défini et appliqué à l'étude approfondie de différents logiciels. Dans le cadre du suivi des évolutions des outils de Text Mining, nous souhaitons élargir ces campagnes ponctuelles à une évaluation continue des outils d'analyse de données contenant du texte. L'objectif annuel est d'évaluer un ou plusieurs outils/méthodes afin d'identifier le potentiel existant en fonction des besoins métiers actuels. De plus, il s'agira de mener des tests permettant d'estimer la performance de l'outil dans une chaîne de traitement similaire à celle aujourd'hui mise en place. Des briques plus spécifiques pourront également être testées (i.e. Tagger morphosyntaxique etc. ...). Il s'agira enfin de mener un état de l'art régulier. Cette alternance se décomposera en 3 parties : - Etat de l'art régulier des outils Text Mining : Il s'agira de mener une étude de marché des outils existants aujourd'hui, à la suite de l'étude menée en 2017. - Evaluation : A partir des solutions émergentes du marché, il s'agira d'évaluer une sélection d'outils jugés à priori pertinents par rapport aux besoins d'EDF. Cette évaluation inclut des tests à l'échelle de la chaîne de traitement actuelle et portera sur différentes fonctionnalités de l'outil (extraction de connaissances, classification, annotation, etc. ...) - Comparaison des résultats avec l'outil actuellement en place à EDF 3. INFORMATIONS PRATIQUES Quand et comment candidater: Fin du recrutement : Lundi 25 juin 2018 Envoyer un CV et une lettre de motivation à Delphine Lagarde et Meryl Bothu Candidater sur le site Internet d'EDF Recrute. Contacts Delphine Lagarde 01.78.19.46.61 delphine.lagarde@edf.fr Meryl Bothua 01.78.19.31.42 meryl.bothua@edf.fr Lieu du stage EDF Lab Paris-Saclay Département ICAME 7 boulevard Gaspart Monge - 91120 Palaiseau Date & Durée 2018 - 1 an Rémunération: A définir