Analyse de la construction sociale du risque en aménagement à l'aide de plongements lexicaux stage M2 en informatique ou traitement automatique des langues Mots clés informatique, traitement automatique des langues (TAL), apprentissage, CamemBERT, aménagement du territoire, environnement Contexte L'impact sur l'environnement humain et naturel est un enjeu de plus en plus courant dans le processus de planification, réalisation et concertation des projets d'infrastructure et d'urbanisme. Cela touche les grands projets (lignes à grande vitesse (LGV), autoroutes, grands stades, etc.) mais aussi, et de plus en plus, les micro-projets (lotissement, ZAC, centre commercial). Un enjeu peut être érigé en risque par les associations, les habitants ou les élus locaux sur la base d'une connaissance fine du territoire et/ou d'études spécialisées et expertes. Ce risque pour l'environnement, notamment s'il contre les textes réglementaires sur la protection de l'environnement, permet aux acteurs de s'opposer au projet lors du débat public ou de l'enquête publique ou à d'autres moments du processus de décision. Cette opposition peut faire annuler, reporter ou modifier le projet d'aménagement. Le processus de construction des enjeux de territoire en incertitude puis en risque (et par conséquent la construction d'une chaine d'incertitudes ou de risques : social puis politique puis financier, etc.) nécessite d'être approfondi en raison de la multiplication des conflits fondés sur le risque, et des enjeux que cela pose en matière de concertation, de participation et de politiques publiques d'aménagement et de protection de l'environnement. Pour comprendre la construction du discours des acteurs opposés à un projet, et la construction des incertitudes et des risques, l'objet du stage est de réaliser une analyse textuelle des positions de ces acteurs dans les registres de débat public, les rapports de l'enquête publique, de la concertation, la presse, etc. et de l'interpréter. Un stage exploratoire a été réalisé en 2020 qui a permis de : - définir les incertitudes et risques à analyser dans le cadre du stage ; - délimiter un corpus de documents pertinents pour cette analyse (Les Cahiers d'acteurs) ; - construire une hiérarchie terminologique thématique (thème : construction d'une LGV) qui organise les éléments permettant de décrire le risque ou l'opportunité dans ce contexte, et en particulier les enjeux (aménagement du territoire, désenclavement des zones mal desservies par les transports, nuisances sonores, impact sur les zones d'intérêt écologique, etc.) ; les acteurs (communes, communautés de communes, associations, groupes d'usagers, particuliers, etc.) ; - adapter un lexique existant des mots de sentiments, opinions, perceptions au thème du risque et de l'opportunité ; - définir un guide pour l'annotation manuelle des documents ; - mettre en place l'annotation manuelle par plusieurs annotateurs, en tant que préalable à la construction d'un modèle d'annotation automatique, et analyser la cohérence des annotations des différents annotateurs par une analyse quantitative. Sujet Ce stage, comme le stage précédent, vise à extraire et analyser les positions des différents acteurs (opportunité ou risque) exprimées dans Les Cahiers d'acteurs mais cette fois-ci avec des outils fondés sur des algorithmes d'apprentissage. La cohérence des annotations manuelles, en l'occurrence celle des éléments qui permettent de caractériser le risque ou l'opportunité et leur évolution, constitue un préalable à toute tentative d'automatisation de l'annotation des documents. Cette cohérence devra être améliorée. Le stage comportera les étapes suivantes : - appropriation des fondamentaux sur les enjeux de contestation des projets, la notion de risque et sa construction socio-technique, en particulier à travers l'analyse du corpus annoté lors du stage précédent, et des ressources terminologiques déjà produites : lexique de sentiments adapté au domaine, hiérarchie terminologique sur la construction d'une LGV ; - rédaction d'un état de l'art concernant les modèles BERT et CamemBERT, et l'utilisation de ressources lexicales (ici, le lexique de sentiments) et terminologiques (ici, sur la construction d'une ligne à grande vitesse) ; - mise en place du modèle CamemBERT pour le corpus des cahiers d'acteurs ; - définition de tâches construites sur les plongements lexicaux par CamemBERT permettant d'identifier et d'analyser les opinions, sentiments, perceptions, émotions concernant les enjeux et les aléas exprimés dans le corpus ; - utilisation des documents déjà annotés pour composer un corpus de validation adapté aux tâches précédentes et de taille suffisante ; - analyse des résultats. Les résultats de cette recherche exploratoire sont destinés aux organismes publics ou privés en charge d'une concertation et au milieu associatif qui y participe. Compétences particulières et formation requise Ce stage s'adresse aux étudiant-e-s de master 2 en informatique ou en TAL avec une formation suffisante pour l'utilisation autonome des outils d'apprentissage, et intéressé-e-s par l'aménagement et l'urbanisme. Lieu du stage Le stage se déroulera sur deux sites avec un rythme hebdomadaire (prévisionnel) de trois ou quatre jours à l'IGN et un ou deux jours au LATTS. Laboratoire en sciences et technologies de l'information géographique Institut national de l'information géographique et forestière 73 avenue de Paris 94165 Saint-Mandé cedex métro ligne 1 - Saint-Mandé ou RER A -Vincennes Laboratoire Techniques Territoires Sociétés 5, boulevard Descartes Cité Descartes 77454 Marne-la-Vallée cedex 2 RER A - Noisy-Champs Durée et rémunération durée : entre 5 et 6 mois début possible à partir d'avril 2021 gratification : environ 550 euros mensuels Débouchés de la recherche et du stage Cette recherche exploratoire a pour objet de déboucher sur l'étude d'un mode de représentation de la construction du risque, ce qui peut permettre de visualiser la façon dont un impact pressenti à un endroit de la concertation est transformé en risque. Une poursuite de la recherche par une thèse peut être envisagée avec deux voies : - tester un mode de représentation du processus de construction du risque dans le temps et dans l'espace et adapté à un public donné (cartographie par exemple) ; - élargir la recherche à d'autres projets comme les ZAC, les lotissements, les équipements de loisirs, etc. Encadrement du stage Geneviève ZEMBRI-MARY, professeure en Aménagement et Urbanisme, université de Cergy-Pontoise, au Laboratoire techniques territoires sociétés (Latts-UPEM, ENPC, CNRS), genevieve.zembri-mary@cyu.fr Catherine DOMINGUÈS, chargée de recherche au Laboratoire en sciences et technologies de l'information géographique (LaSTIG, IGN), HDR, catherine.domingues@ign.fr Chuanming DONG, doctorant ADEME-IGN au LaSTIG, chuanming.dong@ign.fr Pour candidater Le dossier de candidature est à envoyer aux encadrant-e-s avant le 25 janvier 2021 et devra contenir les documents suivants : - CV, - lettre de motivation, - derniers relevés de notes (M1, et premier semestre de M2 si disponible), - description des enseignements suivis (un lien vers le site internet de la formation est le bienvenu), - dernier mémoire ou rapport de stage rédigé