À propos

Prototype d’interface statique pour annoter des appariements.

Code source sur Github

Structure des données

L’objectif est que cet outil soit flexible, il comporte donc un nombre de contraintes minimales à son utilisateur. Celles-ci sont principalement les suivantes:

Le fichier doit être au format csv avec des séparateurs , ;
Les colonnes permettant de comparer les paires sont identifiées par des suffixes. Elles peuvent être plus nombreuses que dans les exemples sur la page, il n’y a pas de contrainte sur le nombre de colonnes à comparer (tant qu’il y en a au moins une).

db = DuckDBClient.of({
  example: FileAttachment("example.csv"),
  example2: FileAttachment("example2.csv")
})

1. Comparaison des paires

Pour la page de comparaison des paires, le suffixe attendu pour dissocier les paires est _query (pour la paire servant de benchmark) ou _match (pour la paire candidate).

Voici un exemple de données respectant cette contrainte:

Inputs.table(
    db.sql`SELECT * FROM example`
)

Pour aider à la comparaison des paires, un visualiseur est proposé. Celui-ci colore les champs identiques en vert 🟢 et les champs différents en rouge 🔴.

2. Choix entre plusieurs algorithmes

Pour la page de comparaison des algorithmes, le suffixe attendu pour dissocier les paires est _query (pour la paire servant de benchmark), _match1 (pour la première paire candidate) ou _match2 (pour la deuxième paire candidate).

Voici un exemple de données respectant cette contrainte:

Inputs.table(
    db.sql`SELECT * FROM example2`
)

Pour aider à la comparaison des paires, un visualiseur est proposé. Celui-ci colore les champs identiques à ceux désirés en vert 🟢 et les champs différents en rouge 🔴.