Journées Data Science & Open Source

Sprint de contribution : 16-17 juin 2026

SSPHub

Pourquoi ce sprint ?

Le réseau SSPHub : la communauté des data scientists du Service Statistique Public (INSEE, DREES, DARES, SDES, CEREQ, ENSAE, Inria…). Nous utilisons des outils open source tous les jours : nous pouvons aussi les améliorer.

  • On se dit souvent : « je ne suis pas assez expert·e », « mon code n’est pas assez propre »
  • La réalité : les projets ont besoin de contributions, et les portes d’entrée sont accessibles à tous : doc, traduction, tests comptent autant que le code

L’objectif du sprint : démystifier la contribution.

Le programme

Mardi 16 juin

Horaire
9h30 ☕ Accueil & café
10h00 🎤 Ouverture
10h30 🎯 Introduction (vous y êtes)
10h45 🎯 Pitch des sujets
11h05 🔀 Formation des groupes
11h15–17h30 💻 Sprint (3 sessions)

Mercredi 17 juin

Horaire
9h00 ☕ Accueil
9h15–15h30 💻 Sprint (2 sessions)
16h00–17h00 🎤 Restitution & Clôture

(sans oublier les pauses déj 🍽️)

Les projets du sprint

Active Tigger

Annotation collaborative de textes avec apprentissage actif.
Emilien Schultz : CREST / ENSAE · github.com/activetigger/activetigger

SNDSTools

Boîte à outils Python/R pour les données de santé (SNDS).
Matthieu Doutreligne : INSEE DEE · sndstoolers.github.io/sndsTools

CanaR

CLI pour déployer des chatbots RAG, en local ou en CI/Docker.
Florian Givernaud : CEREQ · github.com/Romanovytch/canar

UtilitR

La documentation collaborative de R pour le service public.
Julien Blasco : DREES / OSOL · www.book.utilitr.org

Pitchs détaillés à venir

Contibutions libres bienvenues aussi

Contribuer, c’est quoi ?

  • 📖 Documentation : tutoriels, exemples, correction de docs obsolètes
  • 🌐 Traduction : une page de doc pandas en français
  • 🐛 Signalement de bugs : rédiger une issue claire et reproductible
  • Tests : ajouter des cas de test, tester sur des données réelles
  • 🎨 Design & UX : améliorer les messages d’erreur, la doc utilisateur
  • 🧹 Qualité : typos, linting, refactoring mineur
  • 🧑‍🤝‍🧑 Aider : aider les utilisateurs
  • 💻 Code : correction de bugs, nouvelles fonctionnalités (profils avancés)

Astuce

Tout compte. Une traduction de deux paragraphes peut aider des milliers d’utilisateurs.

Avant de contribuer

📖 Lisez le CONTRIBUTING.md du projet : toujours, avant la première ligne. Chaque projet a ses conventions (style, branches, tests, format des PR) ; les suivre, c’est faciliter le travail pour les mainteneurs!

  • 🙋 Annoncez ce que vous prenez : commentez « je prends » sur l’issue avant de commencer
  • 🧩 Une issue à la fois, des PR petites et focalisées (une PR = une chose)
  • 🆘 Demandez de l’aide : les mainteniciens du projets sont aussi là pour accompagner les contributeurs
  • 💬 Bienveillance & patience : respectez le Code of Conduct ; la review peut prendre du temps, c’est normal

Pas d’objectif chiffré. Chacun avance à son rythme : l’exploration et la découverte comptent autant que la contribution soumise.

Et l’IA dans tout ça ?

  • 🧭 Chaque projet a sa propre politique : vérifiez le CONTRIBUTING.md et la doc avant d’utiliser un assistant IA
  • 📣 Certains projets refusent les contributions générées par IA, d’autres demandent de déclarer leur usage dans la PR
  • 🧠 Vous restez responsable de ce que vous soumettez : comprendre, tester et relire chaque ligne
  • ⚖️ Pas de PR générées en masse : qualité avant quantité, respectez le temps des mainteneurs

En cas de doute sur la politique IA d’un projet, demandez aux mainteniciens ! .

Ce dont vous avez besoin

  1. Compte GitHub + Personal Access Token (PAT) créé
  2. SSPCloud : VSCode, Jupyter ou RStudio prêts dans le navigateur sur datalab.sspcloud.fr, rien à installer en local
  3. ✅ Token GitHub enregistré dans SSPCloud (Mon compte → Services externes)

Besoin d’aide pour la config ? Les aidants sont là dès maintenant : levez la main ! La suite (fork, branches, PR, rebase, guidelines) est dans le kit de contribution.

C’est parti !

Ce sprint est un espace pour découvrir, explorer, se donner du temps.

Commencez petit, lisez les guidelines, demandez de l’aide. Bon sprint à toutes et à tous ! 🎉