### Poste d'ingénieur.e de recherche Aix Marseille Université ANR SELEXINI Données et outils pour le développement de méthodes d'induction de lexique Description détaillée en anglais : https://selexini.lis-lab.fr/jobs/2022/03/29/engineer-position - Durée : 12 mois - Début : juin 2022 (adaptable) - Candidature : avant le 2 mai, 2022 par mail à carlos.ramisch [AT] lis-lab.fr - Localisation : LIS (http://www.lis-lab.fr/), équipe TALEP (https://talep.lis-lab.fr/), Aix Marseille Université (https://www.univ-amu.fr/), campus Luminy (https://sciences.univ-amu.fr/sites-geographiques/site-luminy), Marseille - Rémunération (CDD): 1,600¤ à 2,000¤, selon l'expérience L'objectif du projet ANR *SELEXINI (https://selexini.lis-lab.fr/)* est de développer des méthodes originales d'*induction de lexique* en traitement automatique des langues Les lexiques produits par *clustering *rapprocheront des occurrences de mots selon leurs sens, mais contiendront aussi des expressions polylexicales, des *frames* sémantiques, de la structure argumentale, des définitions générées, etc. Les méthodes d'induction de lexique s'appuieront sur des modèles de langage neuronaux (p.ex. FlauBERT, CamemBERT) et sur des ressources lexicales existantes (p.ex. le Wiktionnaire). L'i*ngénieur.e recruté.e aura pour mission de mettre en place l'infrastructure initiale du projet*, à la fois concernant les données et les outils. La mission se déroulera en 5 étapes : (1) préparation d'un grand corpus brut représentatif de divers registres du français écrit, (2) pré-traitement du corpus à l'aide de parseurs, etc., (3) extraction et structuration des entrées du Wiktionnaire français, (4) adaptation (*fine-tuning*) de modèles de langage sur le corpus du projet, (5) alignement des mots et expressions polylexicales extraites du Wiktionnaire avec les occurrences du corpus. ### Profil - Master ou thèse dans un domaine lié au traitement automatique des langues - Notions de français et anglais - Intérêt par les langues et familiarité avec les technologies du langage ### Candidature Envoyez votre CV et quelques lignes expliquant pourquoi vous candidatez à carlos.ramisch [AT] lis-lab.fr avant le 2 May, 2022.