Introduction
Depuis 2020, la pandémie de COVID-19 a mis à rude épreuve l’économie informelle au Sénégal, contraignant les pouvoirs publics et les instituts de statistiques à réagir rapidement pour mesurer l’ampleur de ces bouleversements. Ainsi, l’Agence Nationale de la Statistique et de la Démographie (ANSD) a lancé une série d’enquêtes hebdomadaires, déployées en douze vagues entre avril et juillet 2020, afin de suivre l’évolution de la situation des ambulants, artisans et petits commerçants répartis sur quinze départements. Ces relevés de terrain, couvrant quelque 800 unités par vague, visaient à fournir des données fiables en temps réel pour éclairer les décisions de politique publique et mieux comprendre la résilience des acteurs du secteur informel face à la crise sanitaire.
Au cœur de cet exercice, le cours d’Anonymisation et d’Archivage des données statistiques à l’ENSAE Pierre Ndiaye a proposé aux étudiants de mettre en pratique les standards internationaux de documentation et de diffusion. Il s’agissait de répliquer la fiche d’enquête publiée sur le portail de l’ANSD à l’aide de Nesstar Publisher, puis de déployer l’ensemble des métadonnées sur une instance locale de la plateforme NADA. L’enjeu principal consistait à concevoir un système d’archivage garantissant à la fois la pérennité des fichiers, l’accessibilité pour les utilisateurs futurs et la traçabilité de chaque intervention sur la documentation.
Le projet poursuivait ainsi deux objectifs complémentaires. D’une part, il convenait de structurer et de publier fidèlement l’intégralité des métadonnées au format DDI–XML et Dublin Core, en respectant la hiérarchie des informations (titre, résumé, méthodologie, dictionnaire de variables, crédits et conditions d’accès). D’autre part, il s’agissait pour chaque étudiant de se familiariser avec les outils et bonnes pratiques d’archivage statistique, depuis la saisie des métadonnées dans Nesstar Publisher jusqu’à leur exportation et leur importation dans NADA, en passant par les contrôles de qualité et les validations nécessaires.
Pour cela, le travail a débuté par l’importation des fichiers bruts de l’enquête (formats CSV et SAV) dans Nesstar Publisher, suivi de la saisie détaillée et de la hiérarchisation de chaque élément descriptif. Une fois l’arborescence des métadonnées validée, les exports au format DDI et RDF ont été générés. Parallèlement, l’installation locale de NADA a exigé la configuration d’un serveur web (PHP, MySQL, extensions XSL et GD), puis l’importation des fichiers exportés afin de mettre en ligne la documentation. Chaque étape a été assortie de tests de cohérence et de vérifications manuelles pour garantir l’intégrité des données et la conformité aux standards du Data Documentation Initiative.
Le rapport suit un cheminement logique, d’abord en présentant les fondements théoriques de l’archivage des données statistiques, puis en décrivant le contexte et le déroulement pratique de l’enquête COVID-19. Il détaille ensuite la préparation des métadonnées avec Nesstar Publisher et l’installation de NADA, avant de comparer les résultats obtenus à la fiche ANSD officielle et de partager les enseignements tirés de l’exercice. Enfin, des recommandations sont proposées pour automatiser davantage le processus, renforcer les mécanismes de validation et explorer des solutions d’hébergement collaboratif afin d’optimiser la diffusion et la mise à jour des enquêtes à haute fréquence.