Ingénieur.e science des données et corpus - Laboratoire d'Informatique
de Grenoble

*Analyse, conception, mise en forme et diffusion des corpus vocaux et
multimodaux du LIG et du LIDILEM*

*Poste à pourvoir*: ingénieur- CDD

*Durée *: 1 an (possibilité de prolongation)

*Début *: à partir du 1er septembre 2022

*Date limite de candidature*: 30 juin 2022

*Lieu *: Laboratoire d'informatique de Grenoble - Équipe Getalp

*Domaine *: Traitement Automatique des Langues et de la Parole

*Profil *: Master 2 informatique ou doctorat en
informatique/linguistique

*Contexte*

Le poste à pouvoir est soutenu par la Chaire Artificial Intelligence &
Language de l'Institut MIAI Grenoble Alpes. MIAI est un centre
d'excellence en intelligence artificielle quivise à conduire des
recherches au plus haut niveau, à proposer des enseignements attractifs
pour les étudiant.e.s et les professionnel.le.s de tous les niveaux, à
soutenir l'innovation dans les grandes entreprises, les PMEs et les
startups et enfin à informer et interagir avec les citoyen.ne.s sur
tous les aspects de l'IA.La personne recrutée sera hébergée au sein de
l'équipe GETALP du Laboratoire d'Informatique de Grenoble (LIG), qui
offre un cadre dynamique, international et stimulant pour mener des
recherches pluridisciplinaires de haut niveau. L'équipe GETALP est
hébergée dans un bâtiment moderne (IMAG) situé sur un campus paysager
de 175 hectares qui a été classé huitième plus beau campus d'Europe par
le magazine Times Higher Education en 2018.

*Missions confiées*

    -   Organiser des corpus contenant des données multimodales (audio,
        texte, vidéo).
    -   Traiter et transformer les données en format d'usage pour
        faciliter les traitements et la reproductibilité.
    -   Développer des scripts pour la transformation, le formatage et
        le test des données (Python, Bash, Java).
    -   Superviser des campagnes d'annotation de données (Elan, doccano,
        Brat).
    -   Diffuser ces corpus sur des plateformes ouvertes (ORTOLANG,
        Zenodo, ELRA) et faciliter leur exploitation.
    -   Participer à la rédaction de documents scientifiques et
        techniques.
    -   Assister la mise en oeuvre et gérer divers pipelines logiciels
        pour soutenir l'analyse de données et l'exploration de textes.
    -   Aider les autres membres de l'équipe à réaliser des expériences
        concernant les données.
    -   Documenter le cycle de vie des données et mettre à jour le plan
        de gestion des données.

Vous travaillerez en étroite collaboration avec des doctorants, des
stagiaires et des chercheurs du bassin Grenoblois de l'institut MIAI.

Vous bénéficierez également des compétences et de l'environnement de
recherche de 2 unités de recherche : le LIG (https://www.liglab.fr) et
le LIDILEM (https://lidilem.univ-grenoble-alpes.fr/).

*Compétences*

    -   Master en data science, humanités numériques ou sciences
        sociales computationnelles ;
    -   Maîtrise de l'anglais technique et scientifique ;
    -   Excellent relationnel ;
    -   Savoir travailler en équipe pluridisciplinaire ;
    -   Savoir s'adapter au contexte projet ;
    -   Être autonome dans son organisation personnelle et le
        reporting ;
    -   Avoir une bonne communication écrite et orale en français ;
    -   Maîtrise de langages de scripts (Python, bash, Perl, PhP) ;
    -   Connaissance des outils d'annotations (Elan, Praat) ;
    -   Expérience en outils de linguistique de corpus, en recherche
        sur corpus, en analyse quantitative et qualitative des données.
    -   Une expérience en traitement du langage naturel, traitement de
        la parole ou en linguistique computationnelle sont jugées comme
        un plus.

*Instructions pour postuler*

Les candidatures sont attendues jusqu'au 30 juin 2022.

Veuillez envoyer votre CV + une lettre/message de motivation + les
notes de vos études antérieures + des références pour une ou plusieurs
lettres de recommandation potentielles à :

Francois.portet@imag.fr