Titre: Évaluation des impacts environnementaux et sociaux de la production de corpus d'entrainements pour l'apprentissage machine. Durée: 5-6 mois Niveau: Master 2 (professionnel ou recherche), fin d'école d'ingénieur. Possible d'adapter pour niveau M1. Lieu: Laboratoire LISN, campus de l'université Paris Saclay à Orsay Encadrement: Anne-Laure Ligozat, Clément Morand, Aurélie Névéol, Paola Tubaro LISN, ENSAE contact: clement.morand@lisn.fr résumé: Le secteur de l'intelligence artificielle (IA) connait d'importants développements, avec de nombreuses applications par exemple pour le traitement de données textuelles. Face à ses nombreuses promesses, diverses voix s'élèvent en critiquant notamment les importants impacts environnementaux et sociaux du secteur. Les études sur les implications environnementales et sociales de l'IA exhibent des enjeux similaires, avec par exemple l'exploitation et le renforcement de logiques (néo-)coloniales le long des chaines de valeurs de l'IA, mais, peu de liens existent entre ces champs d'étude. Ce stage a pour objectif d'établir une passerelle entre les travaux en évaluation environnementale de l'IA, et les travaux sur les implications sociales de l'IA. Ce travail sera mis en oeuvre par la réalisation d'un cas d'étude sur la production de corpus d'entrainement pour modèle d'IA, abordé à la fois du point de vue environnemental et du point de vue social. Objectifs du stage: Le stage a pour objectif d'établir une passerelle entre les travaux en évaluation environnementale de l'IA, et les travaux sur les implications sociales de l'IA. Ce travail sera mis en oeuvre par la réalisation 1d'un cas d'étude sur la production de corpus d'entraînement pour modèle d'IA, abordé à la fois du point de vue environnemental et du point de vue social. Approche proposée Le stage se concentrera sur l'étude de cas d'un modèle servant à la désidentification de données approvisionnant l'entrepôt de données de santé d'un hôpital français. Spécifiquement, le stage visera à la réalisation d'une ACV de la production d'un corpus d'entraînement pour un tel modèle. Cette étendue sera réalisée conjointement à une étude visant à caractériser les conditions sociales du travail des données en jeu. L'étude des impacts environnementaux de la production de corpus d'entraînements pourra ensuite être complémentée par une comparaison avec les autres étapes du cycle de vie d'un modèle d'IA (entraînements et utilisation). Compétences souhaitées Le.a stagiaire devra avoir de bonnes compétences en informatique et/ou en sciences sociales quantitatives et/ou computationnelles. Un profil interdisciplinaire avec des compétences en sociologie et en informatique sera particulièrement apprécié. Le contenu et l'ambition du stage pourront être modulées en fonction du niveau d'études et de la durée du stage du/de la candidat.e. Pour postuler veuillez envoyer un mail à l'adresse clement.morand@lisn.fr en joignant votre CV et une lettre de motivations.