Contribution libre

Sélection d’issues prêtes à traiter par projet

Cette page est pour les participants qui souhaitent contribuer à un projet hors des sujets sponsorisés du sprint, ou qui veulent explorer d’autres projets de l’écosystème data science.

Comment utiliser ce document

Cette sélection vise à démystifier la contribution : la plupart des tâches utiles ne sont pas du code algorithmique complexe, mais de la documentation, des tests, du triage et de petits correctifs. Le sprint est un espace pour explorer à son rythme — une issue commentée, une ligne de doc améliorée, une PR ouverte : tout ce qui avance compte.

Avertissement

Avant de vous lancer :

  • lisez le fil de l’issue (quelqu’un est-il déjà dessus ?) ;
  • commentez « je prends » / « I’d like to work on this » pour réserver ;
  • lisez le CONTRIBUTING.md du projet (il répond à 80 % des questions).

Quarto - étendre la possibilité de commenter des sites ou présentations à GitLab

Dépôt : quarto-dev/quarto-cli

  • #8230 — Ajouter l’extension BeBlob à Quarto pour pouvoir commenter des pages html depuis le navigateur vers GitLab

Pynsee

Dépôt : InseeFrLab/pynsee ·

  • #307 — Contribution à pynsee

SciPy

Dépôt : scipy/scipy · Label : good first issue

  • #19389 — Réparer des benchmarks désactivés ou cassés
  • #7168 — Compléter les docstrings sans section « Examples » — un sous-cas par personne
  • #16601 — Optimiser l’assignation dans les matrices creuses plutôt que de les densifier
  • #17387 — Bug : freqz ne fonctionne pas sur les tableaux multidimensionnels malgré la doc

Matplotlib

Dépôt : matplotlib/matplotlib · Label : good first issue

  • #20243 — Bug : eventplot n’affiche pas toutes les données pour un grand nombre d’événements
  • #17479 — Ajouter les vignettes manquantes aux tutoriels / à la galerie
  • #22803 — Bug / perf : taille de fichier excessive avec fill_between()
  • #17775 — Cloner davantage de réglages de légende lors de la régénération dans la boîte de dialogue Qt

scikit-learn

Dépôt : scikit-learn/scikit-learn · Label : Moderate

  • #21138 — Ajouter un exemple illustrant les métriques de ranking
  • #14953 — Handle pd.Categorical dans les encodeurs
  • #14228 — Améliorer la documentation de n_jobs
  • #29600 — Étendre les fonctions de perte de SGDRegressor (Poisson, apprentissage incrémental)

pandas

Dépôt : pandas-dev/pandas · Label : Docs

  • #48423 — Documenter les kwargs de compatibilité NumPy
  • #65813 — Type « quoting » mal formé dans la doc de read_csv
  • #53675to_string / float_format : comportement incohérent avec la documentation
  • #53268 — La compilation d’un seul fichier de doc échoue pour SeriesGroupBy / DataFrameGroupBy

xarray

Dépôt : pydata/xarray · Label : contrib-good-first-issue

  • #11344 — Échec de chargement signalé — à reproduire
  • #11323 — Régression : la 2026.4.0 casse le pickling avec le backend scipy
  • #8239 — Traiter les suggestions de l’outil repo-review (outillage / configuration)
  • #1346 — Bug numérique : moyenne erronée sur un tableau float32 (via bottleneck)

SymPy

Dépôt : sympy/sympy · Label : Easy to Fix

  • #27888refine ne parvient pas à effectuer plusieurs simplifications
  • #15331 — Remplacer l’ascii-art des poutres par des images SVG
  • #28470 — Exposer la doc de LLVMPrinter / llvm_callable dans Sphinx
  • #11345 — Supporter l’ellipsis dans le slicing de matrices

statsmodels

Dépôt : statsmodels/statsmodels · Label : good first issue

  • #6159 — Améliorer les estimateurs de type ARIMA
  • #4269 — Simplifier le calcul GLM dans le cas canonique
  • #8807 — Améliorer et réorganiser les docstrings de robust.norms
  • #771 — Classe de statistiques pondérées pour objets pandas

Dask

Dépôt : dask/dask · Label : good first issue

  • #9158 — Mettre à jour des tests pour utiliser l’argument sort_results
  • #9187 — Standardiser la doc des incompatibilités connues de l’API dask.dataframe
  • #11047 — Ajouter des annotations de type statiques
  • #2629 — Implémenter l’équivalent de scipy.integrate.simps

Hugging Face Transformers

Dépôt : huggingface/transformers · Label : Good Second Issue

  • #46032 — Bug : Mamba2Mixer produit des résultats erronés avec use_cache et seq_len > 1
  • #26350 — Ajouter Flash Attention 2 à d’autres architectures — une archi par personne
  • #33260 — Ajouter le support GGUF à d’autres architectures
  • #30064 — Bug : l’Image Processor échoue sur les cartes de segmentation vides

Polars

Dépôt : pola-rs/polars · Label : good first issue

  • #26290 — Bug : prédicat de skip ignoré pour le dtype booléen dans scan_delta
  • #21898 — Permettre à pl.datetime d’échouer silencieusement
  • #19266 — Ajouter add_filename à read_csv (et autres lecteurs)
  • #2994 — Implémenter le lecteur/écrivain ODBC d’Arrow2

MLflow

Dépôt : mlflow/mlflow · Label : good first issue

  • #23061 — Relever les versions minimales des dépendances ayant des CVE connues
  • #20703 — Bug UI : les artefacts (graphes) ne sont pas mis à l’échelle dans la vue comparaison

Gradio

Dépôt : gradio-app/gradio · Label : good first issue

  • #8826 — Supporter le format de données pointcloud pour Model3D

DuckDB

Dépôt : duckdb/duckdb · Label : needs reproducible example

  • Discussion 5431 : Une discussion pour l’ajout des poids dans les fonctions duckdb (weighted_avg existe déjà et pourrait servir de base)
  • #19712 — Reproduire : erreur au rejeu d’un fichier WAL sans base par défaut
  • #22776 — Reproduire : DISTINCT + ORDER BY DESC + LIMIT ne renvoie qu’une ligne sur de grandes tables
  • #19871 — Reproduire : read_parquet avec jokers échoue quand de nouveaux fichiers sont écrits
  • #22399 — Améliorer un message d’erreur peu détaillé sur une colonne manquante

Pour trouver d’autres issues

Ressource Description
goodfirstissue.dev Filtre par langage
goodfirstissues.com Agrège le label good first issue en direct
up-for-grabs.net Par langage et projet
Recherche GitHub is:open is:issue label:"good first issue" language:python sort:updated-desc