Modélisation et prévision de séries temporelles de consommations électriques locales à partir de données non structurées (réseaux sociaux) _Lieu du stage_ : la Défense (34, place des Corolles) au sein du Département La Fabrique de la direction du Numérique d'Enedis. En partenariat avec l'INP Grenoble. _Contact_ : Anne De Moliner (anne.de-moliner@enedis.fr) _Durée du stage_ : 6 mois. A partir de début 2024 _Profil du candidat_ : Bac + 4 ou 5 spécialisé en Data Science avec expérience en NLP, bonnes pratiques de développement Python et Git, parlant le Français. _Sujet :_ Le sujet vise à traiter les données de réseaux sociaux via des méthodes de NLP (Natural Language Processing) pour améliorer la prévision de séries temporelles de consommation électrique consommation locale (régions, départements, communautés d'agglomérations...). Jusqu'à présent, notre démarche utilise uniquement les hashtags des tweets. On imagine qu'une exploitation du contenu des tweets via NLP devrait permettre de construire des variables plus pertinentes. Il s'agira donc non seulement de trouver des façons d'exploiter le contenu des tweets (analyse émotionnelle / catégorisation en pertinent vs pas pertinent / regroupement automatique des hashtag) pour construire des variables qui décrivent mieux la consommation électrique, mais aussi de déterminer un processus de validation des approches proposées