db = DuckDBClient.of({
example: FileAttachment("example.csv"),
example2: FileAttachment("example2.csv")
})
À propos
Prototype d’interface statique pour annoter des appariements.
Auteur: Lino Galiana
Code source sur Github
Structure des données
L’objectif est que cet outil soit flexible, il comporte donc un nombre de contraintes minimales à son utilisateur. Celles-ci sont principalement les suivantes:
- Le fichier doit être au format
csv
avec des séparateurs,
; - Les colonnes permettant de comparer les paires sont identifiées par des suffixes. Elles peuvent être plus nombreuses que dans les exemples sur la page, il n’y a pas de contrainte sur le nombre de colonnes à comparer (tant qu’il y en a au moins une).
1. Comparaison des paires
Pour la page de comparaison des paires, le suffixe attendu pour dissocier les paires est _query
(pour la paire servant de benchmark) ou _match
(pour la paire candidate).
Voici un exemple de données respectant cette contrainte:
Pour aider à la comparaison des paires, un visualiseur est proposé. Celui-ci colore les champs identiques en vert 🟢 et les champs différents en rouge 🔴.
2. Choix entre plusieurs algorithmes
Pour la page de comparaison des algorithmes, le suffixe attendu pour dissocier les paires est _query
(pour la paire servant de benchmark), _match1
(pour la première paire candidate) ou _match2
(pour la deuxième paire candidate).
Voici un exemple de données respectant cette contrainte:
Pour aider à la comparaison des paires, un visualiseur est proposé. Celui-ci colore les champs identiques à ceux désirés en vert 🟢 et les champs différents en rouge 🔴.