Est-il possible de fusionner des lignes sur tale of data ?

Description du Problème :

Est-il possible de fusionner des lignes sur tale of data ?

Solution :

Exemple n°1 :

image1

Dans le noeud de préparation, choisir la transformation Dédoublonnage Multi-Algorithmes

image2

Choisir l’option « Exact Match » sur la colonne colonneA : Laisser la colonne colonneB décochée

image3

IMPORTANT : Choisir ensuite l’option Fusionner et supprimer les lignes en doublon :

image4

Résultat … une seule ligne :

image5

La ligne n°2 (« A1, B2 ») a logiquement été supprimée puisqu’on a dédoublonné uniquement sur colonneA

Exemple n°2 :

image6

Cette fois, les lignes sont rigoureusement identiques (« A1, B1 »),

Dans le noeud de préparation, on choisit toujours la transformation Dédoublonnage Multi-Algorithmes

Mais, cette fois, on choisit l’option Dédupliquer en utilisant tous les champs (=Lignes identiques) :

image7

On prend toujours l’option fusion (c.a.d Merge) de lignes :

image8

Le résultat est le même :

image5

Si avait on applique la seconde méthode, à savoir : Dédupliquer en utilisant tous les champs (=Lignes identiques)

…au 1er jeu de données, on aurait toujours 2 lignes, puisque dans ce cas, on fusionne 2 lignes uniquement si elles sont identiques pour toutes les colonnes…donc, le résultat serait :

A1, B1

A1, B2

Autre méthode :

opérateur concat (=concaténation de mots) C’est disponible dans le flow designer :

  1. Sur les noeuds d’agrégation

  2. Sur les noeuds window functions

Sur le noeud d’agrégation cela se configure comme ceci :

image10

Et sur le noeud « Window Function » cela se configure comme cela :

image11