Stage Text-Mining et population de bases de connaissances (h/f) Airbus Defence and Space Elancourt Airbus est un leader mondial de l'aéronautique, de l'espace, de la défense et des services associés. En 2017, l'entreprise a dégagé un chiffre d'affaires de 67,0 milliards d'euros avec un effectif d'environ 130 000 personnes. Airbus propose la gamme d'avions de transport de passagers la plus complète, de 100 à plus de 600 sièges. Airbus est également le fournisseur d'avion de ravitaillement, de combat, de transport et de mission leader en Europe, ainsi que le numéro un européen et le numéro deux mondial de l'industrie spatiale. Sur le marché des hélicoptères, Airbus fournit les voilures tournantes civiles et militaires les plus performantes au monde. Nos équipes travaillent avec passion et détermination pour faire du monde un endroit plus connecté, plus sûr et plus intelligent. Fiers de notre travail, nous nous appuyons sur l'expertise et l'expérience de chacun pour atteindre l'excellence. Notre diversité et culture du travail en équipe nous poussent à accomplir l'extraordinaire - sur terre, dans le ciel et dans l'espace. Description du poste / stage Une offre de stage Text-Mining et population de bases de connaissances (h/f) vient de s'ouvrir au sein d'Airbus Defence & Space à Elancourt. Vous rejoindrez l'équipe de Recherche & Développement composée d'ingénieurs, d'étudiants en thèse et de stagiaires, spécialisée dans le text-mining et le traitement massif de l'information non structurée (Big Data). Cette équipe est impliquée dans des projets d'études amont ainsi que divers programmes de recherche partiellement financés par l'Agence Nationale de la Recherche, l'Agence de Défense Européenne ainsi que l'Union Européenne. Contexte : Notre équipe développe actuellement en s'appuyant sur le socle technique open source OW2 WebLab une solution de veille nommée FORTION MediaMining. Cette solution vise à fournir une solution complète de collecte d'information multimédia -texte, image, audio, vidéo - disponible en source ouverte (web, réseaux sociaux), d'analyse (extraction et recherche d'information, transcription de la parole, traduction automatique, etc...) et d'exploitation (visualisation spatio-temporelle, réseau relationnel, statistiques, etc.). Celle-ci dispose notamment de fonctionnalités d'extraction d'information de relations et d'évènement à base de patrons linguistiques permettant d'enrichir des bases de connaissances. Objectif : Notre équipe souhaite extraire à partir de textes éventuellement multilingues (type flux presse) des évènements de différentes natures (militaires, économiques, catastrophes naturelles, etc). Une des difficultés de la tâche d'extraction d'évènements vient de leur nature composite qui nécessite d'extraire différentes dimensions (sémantique, spatiale, temporelle, agentive, numérique) disséminées au sein des textes. Analyse discursive, extraction d'entités nommées, de relations, résolution d'anaphores sont ainsi nécessaires pour couvrir pleinement cette tâche. Les campagnes d'évaluation récentes sur le sujet (ex TAC KDP2017) montrent que de nombreuses pistes d'évaluation restent à explorer (53% de F-Mesure pour le meilleur système à date). Ce stage commencera le 1er février 2019 (Date sujette à flexibilité) et sera d'une durée de 6 mois. Stages chez Airbus Tâches et missions principales, responsabilités Ce stage vise ainsi à étudier la possibilité de remplacer / hybrider les systèmes d'extraction à base de patrons linguistiques par des systèmes à base de réseaux de neurones profonds de type réseaux de neurones récurrents : Contribution à l'établissement d'un état de l'art sur les méthodes d'extraction d'information, de relation et d'évènements à base de méthode d'apprentissage pour la population de base de connaissance. Identification de solutions open source ou de laboratoire. Mise en oeuvre des solutions techniques (apprentissage sur base annotée). Comparaison et évaluation des approches sur un corpus de référence. Ce poste exige une connaissance des risques potentiels de non-conformité. Le/la titulaire s'engage à agir avec intégrité, fondement du succès, de la réputation et de la croissance durable de la Société. Compétences requises Vous préparez un BAC+5 en Traitement d'Information (orienté recherche), options Intelligence Artificielle, Apprentissage automatique, Traitement automatique des Langues, Fouille de données, Extraction d'information à partir de textes. Vous avez une bonne maitrise de Java et Python. Vous avez des connaissances en Framework de Deep Learning type Tensorflow. Vous êtes doté(e) d'un bon esprit d'équipe et d'un bon relationnel. Vous avez un niveau avancé en anglais et Français courant. Candidature en ligne : https://company.airbus.com/careers/jobs-and-applications/search-for-vacancies~lang=fr~jobid=001A4B0A914A1ED8B2F9907C4EB89502~.html