BCEAO - Jour 1
25 septembre 2023
Coopération internationale
Discussion autour de la stratégie big data de l’Insee
Partage de connaissances sur le long terme
Big data : “Gestion et analyse d’un volume massif de données, souvent à une échelle bien supérieure à ce que les systèmes traditionnels peuvent traiter efficacement.”
Les 3 V qui caractérisent les big data :
Disponibilité : réduction du coût et de la charge des enquêtes, des délais de publication (ex : nowcasting)
Finesse : statistiques localisées, sur des sous-population, plus fréquentes…
Avancées méthodologiques : convergence entre statistique et informatique (machine learning)
Exhaustivité : compléter des déclarations d’enquêtes, créer de nouveaux indicateurs…
Mémorandum de Scheveningen (2013) : task force européenne sur le potentiel des big data
Groupe de travail de l’UNECE (2014-2015) : “sandbox” pour manipuler des données concrètes
ESSNET Big Data I (2016-2018) et II (2019-2021)
2015 : projet données de caisses
2016 : poste de statisticien sur les big data
2016 : début de l’exploitation des données mobiles
2018 : labs et premiers développements d’une “plateforme big data”
Démocratique
Législatif
Économique
Méthodologique
Technique
Processus de génération des données non contrôlé
Représentativité généralement limitée
Formats complexes et souvent changeants
Difficultés d’acheminement entre infrastructures
Infrastructures de stockage : les data lakes
Calcul distribué
Services de data science
Importance d’une “sandbox”
Des changements qui impliquent de nombreuses dimensions (juridique, technique, méthodologique, organisationnelle, …)
Le statisticien public ne peut incarner tous ces aspects
Développer des synergies entre toutes les parties prenantes (métiers, informatique, partenaires, …)
Horaires | Activités |
---|---|
8 h 30 - 9 h 00 | Accueil et installation |
9 h 00 - 9 h 15 | Cérémonie d’ouverture par le Directeur des Statistiques |
9 h 15 - 9 h 30 | Pause-café |
9 h 30 - 10 h 45 | Introduction sur la place et les enjeux liés au big data à l’Insee |
10 h 45 - 11 h 00 | Pause-café |
11 h 00 - 12 h 30 | Introduction sur la place et les enjeux liés au big data à l’Insee |
12 h 30 - 14 h 30 | Pause-déjeuner |
14 h 30 - 16 h 00 | Présentation Infra / Outils |
16 h 00 - 16 h 15 | Pause-café |
16 h 15 - 17 h 30 | Prise en main du SSP Cloud |
Horaires | Activités |
---|---|
8 h 30 - 10 h 30 | Sources big data à l’Insee |
10 h 30 - 10 h 45 | Pause-café |
10 h 45 - 12 h 30 | TP 1 : Manipulation des données volumineuses |
12 h 30 - 14 h 30 | Pause-déjeuner |
14 h 30 - 16 h 00 | TP 1 : Manipulation des données massives |
16 h 00 - 16 h 15 | Pause-café |
16 h 15 - 17 h 30 | Retour sur des projets de Machine Learning mis en production à l’Insee |
Horaires | Activités |
---|---|
8 h 30 - 10 h 30 | TP 2 : Introduction à la mise en production et au MLOps |
10 h 30 - 10 h 45 | Pause-café |
10 h 45 - 12 h 45 | TP 2 : Déployer un modèle de machine learning |
Horaires | Activités |
---|---|
8 h 30 - 10 h 00 | Aspects juridiques et réglementaires du big data : un retour d’expérience |
10 h 00 - 10 h 15 | Pause-café |
10 h 15 - 12 h 00 | Retour sur la formation et échange sur la stratégie big data de la BCEAO |
12 h 00 - 13 h 00 | Cérémonie de clôture de l’atelier par le Directeur des Statistiques |