Est-il possible de fusionner des lignes sur tale of data ?
- Description du Problème :
Est-il possible de fusionner des lignes sur tale of data ?
Solution :
Exemple n°1 :
Dans le nœud de préparation, choisir la transformation Dédoublonnage Multi-Algorithmes
Choisir l’option « Exact Match » sur la colonne colonneA : Laisser la colonne colonneB décochée
IMPORTANT : Choisir ensuite l’option Fusionner et supprimer les lignes en doublon :
Résultat … une seule ligne :
La ligne n°2 (« A1, B2 ») a logiquement été supprimée puisqu’on a dédoublonné uniquement sur colonneA
Exemple n°2 :
Cette fois, les lignes sont rigoureusement identiques (« A1, B1 »),
Dans le nœud de préparation, on choisit toujours la transformation Dédoublonnage Multi-Algorithmes
Mais, cette fois, on choisit l’option Dédupliquer en utilisant tous les champs (=Lignes identiques) :
On prend toujours l’option fusion (c.a.d Merge) de lignes :
Le résultat est le même :
Si avait on applique la seconde méthode, à savoir : Dédupliquer en utilisant tous les champs (=Lignes identiques)
…au 1er jeu de données, on aurait toujours 2 lignes, puisque dans ce cas, on fusionne 2 lignes uniquement si elles sont identiques pour toutes les colonnes…donc, le résultat serait :
A1, B1
A1, B2
Autre méthode :
opérateur
concat
(=concaténation de mots) C’est disponible dans le flow designer :
Sur les nœuds d’agrégation
Sur les nœuds window functions
Sur le nœud d’agrégation cela se configure comme ceci :
Et sur le nœud « Window Function » cela se configure comme cela :