SSPHub
  • Home
  • Événements
  • Newsletters
  • Blog
  • Ressources utiles
  • À propos
    • Présentation du réseau
    • Manifeste du réseau
  • Le SSPCloud

📺️ Les présentations et le replay de la journée du réseau, le 1er décembre 2025, sont disponibles

// echo: false
// output: false
inscrits = 730
// echo: false
badge = html`<a href="https://grist.numerique.gouv.fr/o/ssphub/forms/jSjAV3L2F8mmiRVuVEpfF7/103"><img alt="Static Badge" src="https://img.shields.io/badge/${inscrits}_inscrits-blue?style=social&label=⭐️%20Rejoindre%20la%20liste%20de%20diffusion&color=8A2BE2&link=https%3A%2F%2Fgrist.numerique.gouv.fr%2Fo%2Fssphub%2Fforms%2FjSjAV3L2F8mmiRVuVEpfF7%2F103">
</a>
`

Le réseau des data scientists de la statistique publique

// echo: false
html`${badge}`

Le SSPHub centralise et vise à faire connaître le contenu créé par le réseau des data scientists du Service Statistique Publique (SSP).

Une présentation du réseau est disponible sur la page à propos. Pour en savoir plus sur les objectifs du réseau, sa philosophie, et ses modes d’actions, vous pouvez découvrir le Manifeste 📜 écrit collectivement.


Les dernières newsletters

Toutes les newsletters précédemment publiées sont disponibles sur la page dédiée.

Qui pour financer l’open source?

Infolettre du mois de décembre 2025

Dec 10, 2025

De belles cartographies, des packages R et l’importance des données d’entraînement pour l’IA

Infolettre du mois d’octobre 2025

Oct 25, 2025

La rentrée 2025: actualités, nouveautés, interview de rentrée

Infolettre du mois de Septembre 2025

Sep 29, 2025

Sora, la nouvelle IA d’OpenIA pour générer des vidéos ; Le Chat, le nouveau modèle de Mistral ; Observable, pour s’abstraire des notebooks

Infolettre du mois de Mars 2024

Mar 7, 2024

Le RAG pour limiter l’hallucination par l’IA ; l’avancée des bases de données vectorielles ; le format Parquet pour simplifier leur usage ; DuckDB débarque en version web

Infolettre du mois de Février 2024

Jan 20, 2024

Rétrospective du réseau en 2023 (cocorico, beaucoup de nouveaux inscrits !) ; des nouvelles règles européennes pour l’IA ; le recensement de la population au format parquet ; un explorateur de fichier sur le SSPCloud

Infolettre du mois de Décembre 2023

Dec 21, 2023

Coûts d’entrée trop élevés pour l’entraînement des modèles de langage qui s’orientent vers l’opensource ; LlaMaA et Falcon les nouveaux LLM

Infolettre de rentrée, Septembre 2023

Sep 10, 2023

Propositions de lecture estivale

Infolettre estivale, Juillet 2023

Jul 1, 2023

Des innovations rapides sur l’IA qui lancent un débat sur sa place dans la société ; algorithme de recommandation de Twitter

Infolettre du mois d’Avril 2023

Apr 1, 2023

Tapis rouge et graph de l’Insee ; questionnement sur l’IA ; faillite dans la Silicon Valley

Infolettre du mois de Mars 2023, deuxième quinzaine

Mar 15, 2023

ChatGPT continue de faire parler ; Arrow et Polars pour le traitement de données tabulaires ; l’API Huggingface accessible depuis un navigateur web

Infolettre du mois de Mars 2023

Mar 1, 2023

DoReMiFaSol pour récupérer des données de l’Insee ; une masterclass datascientest sur les NLP et l’analyse d’images

Infolettre du mois de Février 2023

Jan 30, 2023

Retex sur 2022, première année du réseau des datascientists ; snapshot de l’état du réseau à date ; présentation de Gridviz

Infolettre du mois de Janvier 2023

Jan 10, 2023

L’année 2022 dans le monde de la data science : IA, transformation de RStudio, Observable

Infolettre du mois de Décembre 2022

Dec 31, 2022

Archive des infolettres et lettres Big Data

Les infolettres et lettres Big Data antérieures 👵👴, avant la publication sous forme de blog

Aug 31, 2022
No matching items

Les derniers billets de blog

L’ensemble des billets de blog peut être retrouvé sur la page dédiée.

Guide d’utilisation des données du recensement de la population au format Parquet

Un post de blog pour accompagner la mise à disposition des données détaillées du recensement au format Parquet.

Oct 23, 2023

Infolettre n°8

La data science a beaucoup fait parler d’elle en 2022, notamment du fait des deux coups médiatiques d’openAI, à savoir…

Dec 31, 2022

Infolettre n°9

Après la rétrospective de l’année 2022 de la data science, il est temps de se pencher sur l’année du réseau avec des visualisations interactives produites grâce à…

Jan 10, 2023

Le plongement lexical ou comment apprendre à lire à un ordinateur

Introduction aux méthodes de traitement du langage naturel.

Oct 3, 2022

Onyxia: l’infrastructure cloud mère des dragons

Les technologies cloud sont incontournables dans l’écosystème de la donnée. Pour ne pas se rendre dépendante de fournisseurs de services externes, l’Insee a développé un…

May 10, 2023

Polars, une alternative fraîche à Pandas

Polars, une alternative moderne et fluide à Pandas

Feb 10, 2023
No matching items

Les réseaux partenaires

Quelques communautés de la data-science avec lesquels nous collaborons

CoP OCDE
Le groupe Community of Practice de l'OCDE est un réseau informel organisé autour des sujets d'innovation statistique.

Lab IA (Etalab)
La communauté des data scientists et acteurs de l’IA pour l’administration française

Onyxia
La communauté Onyxia, à l'origine du SSPCloud, a pour objectif de fournir une plateforme flexible pour expérimenter les outils modernes de la data-science.

Spyrales
Une communauté d'agents de l'Etat pour s'entraider en R et Python

UNECE ML Group
Le travail de recherche du Groupe ML est divisé en 5 groupes de travail visant à traiter différentes problématiques liées à l'utilisation de l'apprentissage automatique pour les statistiques officielles.

grrr
Grrr ("pour quand votre R fait Grrr") est un groupe Slack (plateforme de discussion instantanée) francophone dédié aux échanges et à l’entraide autour de R. Il s'agit du point central de la communauté R francophone. Il est ouvert à tou.te.s et se veut accessible aux débutants. Vous pouvez même utiliser un pseudonyme si vous préférez.
No matching items