Atelier - Comment récupérer des données sous format Parquet ?

Le format Parquet est un format de données connaissant une popularité importante du fait de ses caractéristiques techniques (orientation colonne, compression, interopérabilité…), de sa nature open source et du riche écosystème associé dont les frameworks les plus proéminents sont Arrow et DuckDB. A ces nombreux avantages s’ajoutent une intégration native aux infrastructures cloud basées sur S3, des extensions nombreuses pour traiter des données complexes comme les données géographiques ou, plus récemment, le portage en WASM de DuckDB permettant de construire des applications réactives impliquant des transformations de données directement depuis le navigateur.

Parquet
event
Published

April 16, 2025

L’atelier a eu lieu le 16 avril 2025 (15h - 16h30), en présentiel à l’Insee et en distanciel pour les membres du réseau du SSP Hub. Environ 35 personnes ont participé de l’Insee (DG ou directions régionales), de différents services statistiques ministériels ou d’autres horizons. Merci à tous pour les échanges !

Slides de la présentation

Documentation de l’atelier & replay

Le matériel lié à l’atelier, y compris le replay, est disponible ici.

Questions / contact

Si vous avez la moindre question 🤨, n’hésitez pas à contacter 📧 .