Offre de stage R&D chez ENGIE LAB en Web Sémantique Contexte et principales missions : Vous intégrez une équipe de recherche et de développement d'ENGIE, le Lab CsAi (Computer Science and Artificial Intelligence), où vous participez à la réalisation de solutions autour des technologies du web sémantique. L'objectif de ce stage est de faciliter l'intégration sémantique (accès, partage et alignement) des données structurées hétérogènes non seulement à l'aide des ontologies créées selon des besoins souhaités et/ou des ontologies de domaine existantes mais aussi avec l'alignement aux différentes données du Linked Data à savoir DBpedia, Data.gouv, Wikidata, Geonames, etc. Vous contribuez à mettre en place un outil permettant d'apprendre à lier et à transformer les données structurées (CSV, JSON, XML, HTML, etc.) en se basant sur les concepts d'ontologies et les relations entre eux, et de créer des nouveaux concepts du domaine. Ces ontologies sont développées pour différents domaines d'application, gaz, électricité, bâtiments, eau, IoT, etc. Cet outil vise aussi à faciliter l'enrichissement sémantique du modèle réalisé avec d'autres bases de connaissances. Tâches : - Revue de la littérature scientifique et analyse et veille technologique des développements existants liés aux systèmes d'apprentissage sémantique des données structurées [1,2] - Développer et implémenter des algorithmes pour un nouveau système sémantique robuste à transformer et lier les différentes données structurées issues des cas d'usage métiers ENGIE - Construire du code réutilisable et des bibliothèques pour une utilisation future - Rédiger une documentation technique selon le besoin - Déployer une application répondant aux enjeux scientifiques et métiers. - Rédaction d'articles scientifiques. Formation : Niveau : M2, école ingénieur en informatique, vous avez un profil technique en développement logiciel et une connaissance des technologies de web sémantique. Compétences : - Vous maîtrisez les langages de programmation : Java, Python, script shell, des connaissances en IHM seraient un plus. - Connaissances en technologies du web sémantique : RDF, OWL, SPARQL, etc. - Connaissances en apprentissage et alignement sémantique. - Vous avez une forte capacité d'empathie et le souhait de développer vos connaissances sur les problématiques métiers, liées au domaine de l'énergie. - Vous avez idéalement une connaissance en open data. - Bon niveau d'anglais. Détails du poste : - Le stage se déroulera au CRIGEN, le centre de R&D France d'ENGIE, est situé à Saint Denis. - Durée : 6 mois à temps plein - Rémunération : ce stage fait l'objet d'une rémunération, variable en fonction de l'école et diplôme préparé - Début du contrat : dès que possible - Contact : philippe.calvez1@engie.com et sarra.ben-abbes@external.engie.com (CV + lettre de motivation) [1] Mohsen Taheriyan, Craig A. Knoblock, Pedro A. Szekely, José Luis Ambite: Learning the semantics of structured data sources. J. Web Sem. 37-38: 152-169 (2016) [2] Mohsen Taheriyan, Craig A. Knoblock, Pedro A. Szekely, José Luis Ambite: Leveraging Linked Data to Discover Semantic Relations Within Data Sources. International Semantic Web Conference (2016)