Une sélection de formations et de ressources utiles pour se former ou se perfectionner à la data science.
N’hésitez pas à soumettre les ressources que vous jugez utiles sur notre GitHub .
Formations
Voici une liste de formations en open-source utiles pour tout data-scientist.
L’environnement du Datascientist
Git
Python
R
Quarto
S3, SSPcloud, Parquet, duckDB
Mise en production / MLOps
Méthodologie Statistique
Méthodes ensemblistes
Autres ressources
Funathon 2026 - organisé par l’Insee pour le groupe européen AIML4OS
-
- Sujet 1 - Visualisation des émissions de CO2 de liaisons aériennes : R, API, visualisation
- Sujet 2 - Un tableau de bord du trafic aérien avec R ou Python : R, Python, visualisation, déploiement
- Sujet 3 - Flightradar24 : Python, Dash, Visualisation, Déploiement d’application
- Sujet 4 - Analyse textuelle de commentaires clients : Python, Web Scraping, Analyse de sentiment, NLP, SpaCy
Ressources utiles
Une série de ressources utiles plus diversifiées sur des sujets en lien avec la science des données.
Observable pour la cartographie
neocarto) propose
beaucoup de ressources pédagogiques sur la cartographie depuis Observable.
Beaucoup de ressources s'appuient
sur bertin.js,
une librairie très puissante et flexible pour la représentation cartographique.
Découvrir Observable avec des données françaises
Observable.
Beaucoup s'appuient
sur des données de la statistique publique, comme le fichier des
prénoms ou le recensement.
Introduction à Observable Plot.js
Plot.js
vise à faciliter l'utilisation des fonctionnalités graphiques de
Javascript . Elle propose une syntaxe très proche de celle
des librairies ggplot2 () ou seaborn (Python ).
Utiliser Git dans Jupyter Notebook ?
dataESR: portail de l'open-data du Ministère de l'Enseignement Supérieur
#dataESR est un portail développé
par le service statistique du Ministère de l'Enseignement Supérieur et de la Recherche
pour vous aider à trouver les ressources en données sur l'enseignement supérieur, la recherche et l'innovation.
utilitR
Le projet utilitR est une documentation sur l’usage du logiciel
, née à l’Insee,
destinée à tout utilisateur intéressé par la manipulation de données.
La documentation utilitR ne fait aucun pré-requis de niveau:
à la fois le débutant
et l'utilisateur plus expert désirant découvrir un nouveau champ ou bénéficier
d'une aide-mémoire pourront trouver du contenu qui les intéresse.
Afin que les exemples soient concrets, tous les jeux de données sont issus du site de l'Insee.