DuckDB, let’s go ! 🦆

Installation

Vous pouvez utiliser DuckDB de plein de manières différentes. Ici on va tout faire en ligne de commande (CLI) mais vous être encouragés à tester les SDK de vos langages préférés !

DuckDB CLI est distribué sous forme de binaire standalone, téléchargeable directement sur leur site documentaire.
Il est par ailleurs préinstallé dans la majorité des environnements modernes de datascience dont les environnements lancés par Onyxia

Première utilisation

Lancer duckdb :

gon@laboitemagique:~$ duckdb
v1.3.0 (Ossivalis) 71c5c07cdd
Enter ".help" for usage hints.
Connected to a transient in-memory database.
Use ".open FILENAME" to reopen on a persistent database.

On constate bien que duckdb travaille uniquement en mémoire (transient in-memory database). Toutes les données seront donc perdues à la fin de la session.
Si on veut qu’il sauvegarde ses tables, on peut préciser un fichier de database au moment du lancement duckdb madb.db ou à chaud pendant une session : .open madb.db.

Hello world

https://duckdb.org/docs/stable/sql/introduction.html

Optionnel : configuration

Pour configurer la CLI vous avez la possibilité de créer un fichier .duckdbrc à la racine de votre répertoire personnel ($HOME). Ce fichier vous permettra d’exécuter du code au lancement de votre session duckdb.

.prompt 'duckdb>'
CREATE OR REPLACE SECRET secret ( TYPE s3, PROVIDER credential_chain, CHAIN "env;config", PROFILE 'default',  ENDPOINT "minio.lab.sspcloud.fr" );