Offre de Stage en Linguistique-Informatique / Traitement automatique des langues Extraction automatique d'informations pertinentes et création de thésaurus. Référence : LGST-INF-1 Merci d'envoyer votre CV & Lettre de motivation à l'adresse suivante : contact@aerial-group.com Présentation d'Aerial AERIAL a pour c½ur de métier le conseil en pilotage d'entreprise. Sa vocation est de faire évoluer le mode de fonctionnement de l'entreprise pour lui permettre d'obtenir une amélioration simultanée de ses ratios de productivité et de sa capacité de croissance. Pour exercer cette vocation, AERIAL intervient, sans modifier en profondeur les structures, à la fois : - Sur le pilotage stratégique de l'entreprise pour lui apporter souplesse et réactivité - Sur le pilotage de son système d'information pour en faire un outil d'amélioration de son efficience - Sur le pilotage de l'innovation pour lui permettre d'anticiper sur son marché Description du poste : Dans le cadre de son offre DPO (http://www.aerial-group.com/nos-approches/509-2/), vous participerez au développement d'un système de management de l'information innovant, permettant d'extraire automatiquement des informations pertinentes. Pour ce faire nos clients nous confient leurs données stockées en interne et/ou nous faisons pour eux une veille externe. Ces données sont ensuite analysées sémantiquement en profondeur pour détecter les informations pertinentes et les champs lexicaux utiles au domaine puis restituées graphiquement au travail d'une plateforme SAAS. La pertinence de l'extraction d'information dans les corpus client est donc un enjeu très fort au sein d'Aerial. Le stagiaire devra dans un premier temps mettre en ½uvre une analyse de corpus pour identifier le focus ainsi que les attributs pertinents pour le client. Puis à partir de cette analyse, modéliser l'information pertinente par des patrons morphosyntaxiques, et/ou par la création de thésaurus sémantiquement pertinent pour le domaine client. Enfin, le stagiaire pourra intervenir sur des actions correctrices et des paramétrages sémantiques de l'outil. Compétences techniques : - XML - Expressions régulières - Sémantique - Morphosyntaxe - Traitement automatique du langage Compétences individuelles : - Analyse - Méthode - Rigueur - Autonomie - Aptitudes à travailler en équipe - Esprit d'analyse, de synthèse - Curiosité dans le domaine Profil et expérience De formation BAC+ 4/5 (école d'ingénieur ou universitaire) en linguistique informatique, Linguistique avancée et appliquée aux sciences et techniques de l'information et de la communication spécialité traitement automatique du langage ou équivalent avec des connaissances premières en Text-Mining. Dynamique, autonome et organisé(e), vous faite preuve de rigueur et de professionnalisme. Type de contrat Stage d'une durée de 6 à 12 mois Lieu Paris Rémunération En fonction du profil du candidat