Offre de stage : stage TAL arabizi tunisien, 4 à 6 mois Objet : normalisation de l'écriture de l'arabe tunisien sur les réseaux sociaux Employeur : Institut National des Langues et Civilisations Orientales (INALCO) Contrat : stage M1 ou M2 de 4 à 6 mois Lieu de Travail : Maison de la recherche de l'INALCO, 2 rue de Lille 75007 Paris Rémunération : 554 ¤ / mois + prise en charge partielle des transports IdF Date de début : dès que possible CONTEXTE Le projet a pour cadre général le traitement automatique de l'arabe tunisien, langue peu dotée et non codifiée dont l'écriture sur les réseaux sociaux est diverse (arabizi, alphabet arabe, emprunts, etc.). Le tunisien est peu étudié malgré une quantité grandissante de données disponibles notamment grâce à l'essor des réseaux sociaux. OBJECTIF Le stage vise à effectuer : - un état de l'art approfondi sur la standardisation de l'arabizi, - la normalisation d'un corpus issu des réseaux sociaux en arabe tunisien (arabizi) : définition d'une norme orthographique de l'arabizi, identification des formes les mieux attestées, correction du corpus en fonction de la norme établie, - l'implémentation d'un algorithme de correction orthographique. PROFIL ATTENDU - M1 ou M2 en Traitement Automatique des Langues, linguistique ou informatique, - maîtrise de l'arabe tunisien (arabizi), - connaissances en sciences du langage (morphologie, lexicologie), - connaissances des problématiques du TAL, - maîtrise d'un langage de programmation (de préférence Python). Pour des raisons pratiques, le/la candidat-e doit déjà être en France ou doit avoir le droit de travailler en France. La convention de stage est obligatoire. CANDIDATURE Pour candidater, merci d'envoyer un CV et une lettre de motivation à asma.zamiti@inalco.fr et mathieu.valette@inalco.fr