Proposition de post-doc sur 1 ans, financé par Arkéa / Crédit Mutuel http://perso.telecom-bretagne.eu/yannisharalambous/data/Arkea-postdoc-05-2016.pdf Titre : Détection, représentation et prévention de conflits techniques, syntaxiques et sémantiques au sein d'un système d'information bancaire Résumé du projet : Les processus complexes en informatique de gestion sont composés de milliers de traitements en interconnexion et à large échelle, entre les producteurs de données et les traitements de reporting les exploitant. Une des grandes difficultés à laquelle sont confrontés ces systèmes est celle de l'occurrence d'erreurs rares mais pouvant entraîner des graves dysfonctionnements et amenant à une intervention rapide d'experts pour corriger les problèmes. Ainsi, des dysfonctionnements peuvent apparaître suite à des problèmes d'ordonnancement, de défaut physique (machine), de défaut de période (donnée du mois précédent au lieu du mois en cours), de défaut de valeur (valeurs incorrectes) ou enfin de défaut atypique. Le problème est rendu complexe par le nombre d'interconnexions en jeu, la rareté des incidents comparée au nombre de traitements et processus opérés ainsi que la temporalité menant à une erreur (effet papillon). Par ailleurs les dysfonctionnements ne sont pas toujours évidents à comprendre par les experts en charge du système informatique. Ce sujet de post-doc porte sur une taxonomie et sémantique des types d'erreurs et la mise en oeuvre d'un système observant et apprenant, capable de détecter au plus tôt des dysfonctionnements, de les présenter de façon synthétique à un et de lui montrer l'imminence d'un défaut, ou même de proposer des corrections préventives. Ce système se basera sur les traces d'utilisations enregistrées dans des bases de connaissances, qui contiennent des séquences d'événements `normales' et des séquences contenant des dysfonctionnements associés à des corrections passées ainsi que sur des signatures sémantiques des entrées-sorties des processus. Il pourra être branché en ligne pour accroître son expertise au cours du temps. Deux verrous seront abordés : - l'apprentissage de séquences sémantico-spatio-temporelles en temps réel ; - la représentation synthétique (graphique et textuelle) de la dynamique des données complexes. Les sources de données exploitables sont multiples, sondes physiques / mécaniques, bases de données des incidents, bases de données des évolutions, bus événementiels, les data warehouses, et enfin les diagnostics-expert de l'observant, qui enrichissent en direct le moteur d'aide à la décision. La solution proposée sera assez générique pour s'appliquer à des cadres applicatifs différents : de l'informatique de gestion aux big data multiplateforme. L'étude et la réalisation finale doivent permettre d'aboutir à un démonstrateur, permettant le test et l'analyse de différent cas d'usage et d'éprouver les concepts mis en oeuvre. Lieu : Télécom Bretagne, Brest. (Laboratoire Lab-STICC, équipe DECIDE) Contact : yannis.haralambous@telecom-bretagne.eu et laurent.le-bodic@arkea.com Début de contrat : octobre 2016