Emploi : Freelance Mission Infolinguiste au sein du DataLab Groupe Crédit Agricole SA ======================================================================== Contexte Dans le cadre de ses développements, le DataLab Groupe Crédit Agricole souhaite renforcer son équipe IA sémantique par un infolinguiste expérimenté. Durée : 3 mois (possibilité de renouvèlement) Lieu de travail : DataLab Groupe Date de démarrage souhaitée : Janvier/février 2020 Rémunération : selon profil Candidature : envoi d'un CV Contacts: Aymen SHABOU (aymen.shabou@credit-agricole-sa.fr), Yulia KOLOSKOVA (Yulia.koloskova@credit-agricole-sa.fr) Description Le DataLab Groupe Crédit Agricole souhaite confier à la personne recrutée la mission suivante : 1. Mise en place des projets d'annotation - Co-construction avec le métier de bases de connaissance (plan de classements, modèles de données, etc.) répondant aux besoin métier - Rédaction des guidelines d'annotation - Cadrage des projets annotation, suivi de métriques de performance - Suivi et supervision des phases annotations avec le métier et les annotateurs, participation dans l'annotation en tant que reviewer 2. Construction des bases de connaissances spécifiques aux différents projets d'analyse sémantique - Formalisation de règles métier - Création de ressources linguistiques et adaptation de ressources existantes (ontologies, lexique etc.) - Analyse syntaxique et sémantique de corpus, extraction de concepts par des méthodes linguistiques et statistiques - Analyse des sentiments/émotions 3. Développement des briques linguistiques de prétraitement de données et de prédiction - Développements des modules linguistiques d'analyse de langage naturel (analyse syntaxique, règles linguistiques, grammaires locaux, analyse des sentiments) - Enrichissement de modèles de classification ML par des méthodes infolinguistiques - Exploitation des outils open-sources ou du marché pour l'analyse sémantique de données textuelles - Collaboration avec les autres data scientists de l'unité et leur accompagnement dans l'intégration des approches linguistiques à l'ensemble de la chaine de traitement L'infolinguiste sera accompagné par l'équipe data science. Il devra, par ailleurs, fournir les livrables suivants : - Guides d'annotation - Ressources linguistiques - Codes sources commentés et « reviewés » - Présentation et partage des travaux La mission doit démarrer en janvier/février 2020 pour une durée de 3 mois (60J). Le renouvellement de la mission dépendra de l'avancement des développements. Des revues itératives seront mises en place afin de produire de manière continue des résultats et orienter les développements Compétences - De fortes compétences d'analyse linguistique de corpus et de création de ressources linguistiques, capacité de faire de la veille technologique - Bonne maitrise de méthodes et une expérience pratique dans le domaine d'annotation - Maitrise de l'environnement de développement linguistique, développement en Python - Expérience dans le domaine du TAL (3-5 ans) - Ecoute, partage et communication - Grande rigueur et autonomie - Aptitude pour le travail en équipe