Conclusion et discussion

BCEAO - Jour 4

25 septembre 2023

Big data : une définition pragmatique

  • Une notion aux contours flous

  • Une définition pragmatique

    • Volumétrie : difficiles à traiter sur des environnements usuels
    • Variété : nécessite des méthodes de traitement non-standard
    • Généralement non-collectée à des fins de statistique publique

Une transformation continue

  • De multiples dimensions (démocratique, juridique, économique, méthodologique, technique)
    • Des défis souvent déjà existants !
  • Une transformation continue plutôt qu’une rupture
    • Montée en compétence collective
    • Innover sur les modes d’organisation

Recommendations

  • Donner les moyens d’innover
  • Commencer par des projets pilotes pour prouver l’intérêt

Enjeux démocratiques et cadre juridique

  • Arbitrage à trouver
    • De nouvelles sources statistiques prometteuses
    • Conserver la confiance des citoyens
  • Le cadre juridique est garant de cette confiance
    • Nécessité d’ajustements fréquents

Recommendations

  • Assurer une veille sur l’évolution de la législation
  • Faire attention aux licences d’utilisation

Enjeux économiques

  • Des données souvent produites par des acteurs privés
    • Pas toujours la main sur le mode de collecte
    • Volonté des acteurs de valoriser ces données

Recommendations

  • Nouer des partenariats basés sur des intérêts réciproques
  • S’inspirer des expériences passées (cf. ressources ESSNET Big Data)

Infrastructure

  • Adoption de technologies modernes et évolutives
    • Stockage objet centralisé
    • Conteneurisation
  • Faciliter l’accès aux statisticiens

Recommendations

  • Mettre une sandbox à disposition pour l’innovation
  • Visio à venir sur les choix d’architecture

Des outils à adapter

  • Transition vers des outils informatiques adaptés
    • Format de fichier : Parquet
    • Traitement de données volumineuses : Arrow
    • Traitement de données massives : Spark

Recommendations

  • Transitionner vers des langages et outils open-source (R, Python)
  • Appliquer ces technologies à un projet concret

De statisticien à data scientist

  • Veille méthodologique
    • Traitement des données non-structurées
    • Méthodes de machine learning
  • Acculturation aux outils informatiques
    • Calcul distribué
    • Outils pour la mise en production

Recommendations

Discussion

  • Retours sur la formation : durée, format des supports, répartition théorie/pratique, etc.

  • Identifier des besoins en documentation

  • Discussion autour des sujets prioritaires pour la BCEAO

  • Suites de la collaboration