Un nouveau catalogue pour l’accès aux données quantitatives en SHS

PROGEDO et ses partenaires (INED, CDSP, Cepremap) mettent à disposition des chercheurs en SHS un nouveau catalogue de données pour la recherche de Quetelet-Progedo-Diffusion : https://data.progedo.fr

Le site gouvernemental https://data.gouv.fr donne accès aux données ouvertes, et est désormais complété par un site spécifiquement dédié aux données de recherche. Le comité du secret statistique autorise l’accès aux données confidentielles sous la forme de fichiers détaillés ou pseudonymisés. Les données confidentielles détaillées sont accessibles via le centre d’accès sécurisé aux données. Les fichiers pseudonymisés (aussi appelés « Fichiers Production Recherche » ou FPR) sont, quant à eux, accessibles via le dispositif « Quetelet-Progedo-Diffusion ».

À l’initiative du Laboratoire d’Analyse Secondaire et de Méthodes Appliquées à la Sociologie (LASMAS), et dans la continuité des préconisations du rapport sur « les sciences sociales et leurs données »1 , les chercheurs et chercheuses disposent depuis plus de vingt ans d’un dispositif original pour accéder aux données de la statistique publique, c’est-à-dire les « registres administratifs » et les « enquêtes directes » produites par les gouvernements et leurs administrations. Ce dispositif, connu sous le nom d’archives de données issues de la statistique publique, prend aussi en charge certaines données issues de la recherche (grandes enquêtes et base de données quantitatives).

Le catalogue et l’outil de commande de Quetelet-Progedo-Diffusion dataient d’une dizaine d’années et étaient devenus obsolètes. Un nouveau catalogue vient donc d'être mis à disposition. Une visite en image des principales nouveautés est disponible ici : https://progedo.hypotheses.org/3081

Quelques nouveautés :

  • Une interface épurée pour trouver rapidement les données que vous cherchez.
  • La fin de la navigation à travers les 3 sites web (ORDS, BdQ et serveurs Nesstar).
  • Tous les diffuseurs dans un même catalogue.
  • Une meilleure compatibilité avec les métacatalogues existants (Isidore; le Cessda Data Catalogue; EOSC…).
  • De nouvelles fonctionnalités :
    • Un outil de recherche amélioré
    • Des filtres pour affiner ses recherches
    • Présentation détaillée des variables
    • DOI pour identifier chaque jeu de donnée

À travers une interface ergonomique, les chercheurs et chercheuses peuvent interroger l’ensemble des 1 500 jeux de données (dont 97 séries temporelles) et 380 000 variables. Les résultats de la recherche s’affichent « à la volée » pour les séries, les jeux de données et les variables. Chaque jeu de données est désormais doté d’un identifiant unique DOI, ce qui permet de les gérer en utilisant des logiciels comme EndNote ou Zotero et donc de faciliter la citation des données dans les articles.

Enfin, ce catalogue est désormais accessible via le métacatalogue du Consortium européen des archives de données en Sciences Sociales (CESSDA) et participe donc à l’European Open Science Cloud (EOSC).