Ingénieur.e science des données et corpus - Laboratoire d'Informatique de Grenoble *Analyse, conception, mise en forme et diffusion des corpus vocaux et multimodaux du LIG et du LIDILEM* *Poste à pourvoir*: ingénieur- CDD *Durée *: 1 an (possibilité de prolongation) *Début *: à partir du 1er septembre 2022 *Date limite de candidature*: 30 juin 2022 *Lieu *: Laboratoire d'informatique de Grenoble - Équipe Getalp *Domaine *: Traitement Automatique des Langues et de la Parole *Profil *: Master 2 informatique ou doctorat en informatique/linguistique *Contexte* Le poste à pouvoir est soutenu par la Chaire Artificial Intelligence & Language de l'Institut MIAI Grenoble Alpes. MIAI est un centre d'excellence en intelligence artificielle quivise à conduire des recherches au plus haut niveau, à proposer des enseignements attractifs pour les étudiant.e.s et les professionnel.le.s de tous les niveaux, à soutenir l'innovation dans les grandes entreprises, les PMEs et les startups et enfin à informer et interagir avec les citoyen.ne.s sur tous les aspects de l'IA.La personne recrutée sera hébergée au sein de l'équipe GETALP du Laboratoire d'Informatique de Grenoble (LIG), qui offre un cadre dynamique, international et stimulant pour mener des recherches pluridisciplinaires de haut niveau. L'équipe GETALP est hébergée dans un bâtiment moderne (IMAG) situé sur un campus paysager de 175 hectares qui a été classé huitième plus beau campus d'Europe par le magazine Times Higher Education en 2018. *Missions confiées* - Organiser des corpus contenant des données multimodales (audio, texte, vidéo). - Traiter et transformer les données en format d'usage pour faciliter les traitements et la reproductibilité. - Développer des scripts pour la transformation, le formatage et le test des données (Python, Bash, Java). - Superviser des campagnes d'annotation de données (Elan, doccano, Brat). - Diffuser ces corpus sur des plateformes ouvertes (ORTOLANG, Zenodo, ELRA) et faciliter leur exploitation. - Participer à la rédaction de documents scientifiques et techniques. - Assister la mise en oeuvre et gérer divers pipelines logiciels pour soutenir l'analyse de données et l'exploration de textes. - Aider les autres membres de l'équipe à réaliser des expériences concernant les données. - Documenter le cycle de vie des données et mettre à jour le plan de gestion des données. Vous travaillerez en étroite collaboration avec des doctorants, des stagiaires et des chercheurs du bassin Grenoblois de l'institut MIAI. Vous bénéficierez également des compétences et de l'environnement de recherche de 2 unités de recherche : le LIG (https://www.liglab.fr) et le LIDILEM (https://lidilem.univ-grenoble-alpes.fr/). *Compétences* - Master en data science, humanités numériques ou sciences sociales computationnelles ; - Maîtrise de l'anglais technique et scientifique ; - Excellent relationnel ; - Savoir travailler en équipe pluridisciplinaire ; - Savoir s'adapter au contexte projet ; - Être autonome dans son organisation personnelle et le reporting ; - Avoir une bonne communication écrite et orale en français ; - Maîtrise de langages de scripts (Python, bash, Perl, PhP) ; - Connaissance des outils d'annotations (Elan, Praat) ; - Expérience en outils de linguistique de corpus, en recherche sur corpus, en analyse quantitative et qualitative des données. - Une expérience en traitement du langage naturel, traitement de la parole ou en linguistique computationnelle sont jugées comme un plus. *Instructions pour postuler* Les candidatures sont attendues jusqu'au 30 juin 2022. Veuillez envoyer votre CV + une lettre/message de motivation + les notes de vos études antérieures + des références pour une ou plusieurs lettres de recommandation potentielles à : Francois.portet@imag.fr