Contribution libre

Sélection d’issues prêtes à traiter par projet

Cette page est pour les participants qui souhaitent contribuer à un projet hors des sujets sponsorisés du sprint, ou qui veulent explorer d’autres projets de l’écosystème data science.

Comment utiliser ce document

Cette sélection vise à démystifier la contribution : la plupart des tâches utiles ne sont pas du code algorithmique complexe, mais de la documentation, des tests, du triage et de petits correctifs. Le sprint est un espace pour explorer à son rythme — une issue commentée, une ligne de doc améliorée, une PR ouverte : tout ce qui avance compte.

Avertissement

Avant de vous lancer :

lisez le fil de l’issue (quelqu’un est-il déjà dessus ?) ;
commentez « je prends » / « I’d like to work on this » pour réserver ;
lisez le CONTRIBUTING.md du projet (il répond à 80 % des questions).

Quarto - étendre la possibilité de commenter des sites ou présentations à GitLab

Dépôt : quarto-dev/quarto-cli

#8230 — Ajouter l’extension BeBlob à Quarto pour pouvoir commenter des pages html depuis le navigateur vers GitLab

Pynsee

Dépôt : InseeFrLab/pynsee ·

#307 — Contribution à pynsee

SciPy

Dépôt : scipy/scipy · Label : good first issue

#19389 — Réparer des benchmarks désactivés ou cassés
#7168 — Compléter les docstrings sans section « Examples » — un sous-cas par personne
#16601 — Optimiser l’assignation dans les matrices creuses plutôt que de les densifier
#17387 — Bug : freqz ne fonctionne pas sur les tableaux multidimensionnels malgré la doc

Matplotlib

Dépôt : matplotlib/matplotlib · Label : good first issue

#20243 — Bug : eventplot n’affiche pas toutes les données pour un grand nombre d’événements
#17479 — Ajouter les vignettes manquantes aux tutoriels / à la galerie
#22803 — Bug / perf : taille de fichier excessive avec fill_between()
#17775 — Cloner davantage de réglages de légende lors de la régénération dans la boîte de dialogue Qt

scikit-learn

Dépôt : scikit-learn/scikit-learn · Label : Moderate

#21138 — Ajouter un exemple illustrant les métriques de ranking
#14953 — Handle pd.Categorical dans les encodeurs
#14228 — Améliorer la documentation de n_jobs
#29600 — Étendre les fonctions de perte de SGDRegressor (Poisson, apprentissage incrémental)

pandas

Dépôt : pandas-dev/pandas · Label : Docs

#48423 — Documenter les kwargs de compatibilité NumPy
#65813 — Type « quoting » mal formé dans la doc de read_csv
#53675 — to_string / float_format : comportement incohérent avec la documentation
#53268 — La compilation d’un seul fichier de doc échoue pour SeriesGroupBy / DataFrameGroupBy

xarray

Dépôt : pydata/xarray · Label : contrib-good-first-issue

#11344 — Échec de chargement signalé — à reproduire
#11323 — Régression : la 2026.4.0 casse le pickling avec le backend scipy
#8239 — Traiter les suggestions de l’outil repo-review (outillage / configuration)
#1346 — Bug numérique : moyenne erronée sur un tableau float32 (via bottleneck)

SymPy

Dépôt : sympy/sympy · Label : Easy to Fix

#27888 — refine ne parvient pas à effectuer plusieurs simplifications
#15331 — Remplacer l’ascii-art des poutres par des images SVG
#28470 — Exposer la doc de LLVMPrinter / llvm_callable dans Sphinx
#11345 — Supporter l’ellipsis dans le slicing de matrices

statsmodels

Dépôt : statsmodels/statsmodels · Label : good first issue

#6159 — Améliorer les estimateurs de type ARIMA
#4269 — Simplifier le calcul GLM dans le cas canonique
#8807 — Améliorer et réorganiser les docstrings de robust.norms
#771 — Classe de statistiques pondérées pour objets pandas

Dask

Dépôt : dask/dask · Label : good first issue

#9158 — Mettre à jour des tests pour utiliser l’argument sort_results
#9187 — Standardiser la doc des incompatibilités connues de l’API dask.dataframe
#11047 — Ajouter des annotations de type statiques
#2629 — Implémenter l’équivalent de scipy.integrate.simps

Hugging Face Transformers

Dépôt : huggingface/transformers · Label : Good Second Issue

#46032 — Bug : Mamba2Mixer produit des résultats erronés avec use_cache et seq_len > 1
#26350 — Ajouter Flash Attention 2 à d’autres architectures — une archi par personne
#33260 — Ajouter le support GGUF à d’autres architectures
#30064 — Bug : l’Image Processor échoue sur les cartes de segmentation vides

Polars

Dépôt : pola-rs/polars · Label : good first issue

#26290 — Bug : prédicat de skip ignoré pour le dtype booléen dans scan_delta
#21898 — Permettre à pl.datetime d’échouer silencieusement
#19266 — Ajouter add_filename à read_csv (et autres lecteurs)
#2994 — Implémenter le lecteur/écrivain ODBC d’Arrow2

MLflow

Dépôt : mlflow/mlflow · Label : good first issue

#23061 — Relever les versions minimales des dépendances ayant des CVE connues
#20703 — Bug UI : les artefacts (graphes) ne sont pas mis à l’échelle dans la vue comparaison

Gradio

Dépôt : gradio-app/gradio · Label : good first issue

#8826 — Supporter le format de données pointcloud pour Model3D

DuckDB

Dépôt : duckdb/duckdb · Label : needs reproducible example

Discussion 5431 : Une discussion pour l’ajout des poids dans les fonctions duckdb (weighted_avg existe déjà et pourrait servir de base)
#19712 — Reproduire : erreur au rejeu d’un fichier WAL sans base par défaut
#22776 — Reproduire : DISTINCT + ORDER BY DESC + LIMIT ne renvoie qu’une ligne sur de grandes tables
#19871 — Reproduire : read_parquet avec jokers échoue quand de nouveaux fichiers sont écrits
#22399 — Améliorer un message d’erreur peu détaillé sur une colonne manquante

Pour trouver d’autres issues

Ressource	Description
goodfirstissue.dev	Filtre par langage
goodfirstissues.com	Agrège le label `good first issue` en direct
up-for-grabs.net	Par langage et projet
Recherche GitHub	`is:open is:issue label:"good first issue" language:python sort:updated-desc`