Guide de démarrage

Note

Un tutoriel vidéo est disponible ici en complément de la documentation ci-dessous.

Tale of Data est un logiciel conçu pour les utilisateurs métier, afin de leur permettre de reprendre confiance dans leurs données et donc de prendre de bonnes décisions.

Tale of Data propose les fonctionnalités suivantes, sans avoir besoin d’écrire du code :

  • Fiabilisation intelligente des données,

  • Contrôle de la conformité des données,

  • Découverte des jeux de données disséminés au sein du Système d’Information,

  • Cartographie sémantique (nature des données) et cartographie des anomalies,

  • Croisement de sources de données hétérogènes, augmentation des données,

  • Automatisation des contrôles, des alertes et des opérations de remédiation.

Principes fondamentaux

Des données auditées, fiabilisées par les métiers pour des décisions avisées afin de maximiser vos résultats et minimiser vos risques !

starter-image1

Définitions

Flow

Un flow est un traitement construit sous forme graphique. Il est constitué:

  • De données en entrée,

  • D’un ensemble de transformation,

  • De données de sortie.

Nœud

Un nœud est représenté par des icônes dans un flow.

Un un nœud va servir à représenter par exemple :

  • starter-image2 Les données de départ, appelées “nœud source”,

  • starter-image3 Les données d’arrivée, appelées “nœud cible “,

  • Les traitements utilisés pour transformer, corriger ou compléter les données. On utilisera par exemple un nœud filtre starter-image4 ou un nœud enrichissement starter-image5 dans les traitements de notre flow dans cette section.

Description des icônes Tale of Data

Tale of Data affiche des icônes pour vous guider.

starter-image6 Un astérisque indique qu’il est obligatoire de remplir le champ.

starter-image7 Une bulle avec un point d’exclamation indique qu’un paramètre est manquant. De plus, cette icône vous fournit une aide pour y remédier lorsque vous déplacez votre souris dessus.

Ecran d’accueil

Après avoir saisi votre identifiant et votre mot de passe, l’écran d’accueil apparaît.

starter-image8

Vous retrouvez à gauche de l’écran le menu principal de Tale of Data qui restera toujours visible.

starter-image9

Le menu accessible en cliquant sur votre profil utilisateur (en haut à gauche) permet de:

  • Paramétrer ses préférences utilisateur

  • Télécharger la documentation au format PDF

  • Se déconnecter.

starter-image10

Catalogue

Le catalogue est accessible depuis le menu principal de Tale of Data. Il permet:

  • d’accéder aux jeux de données

  • d’accéder à la liste des référentiels

  • d’ajouter de nouvelles sources de données

Créer son premier Flow

Objectif

Dans le cadre de ce guide de démarrage, nous allons créer un Flow « simple ». Ce Flow aura pour objectif de prendre des données dans un fichier, d’en filtrer certaines lignes, et d’écrire les résultats vers un autre fichier.

Pour y parvenir, vous devrez créer et paramétrer :

starter-image11 Un nœud source,

starter-image12 Un nœud cible,

starter-image13 Un nœud filtre.

Indication

Ce Flow permet à un nouvel utilisateur de se familiariser avec les concepts de Tale of Data. Il s’agit d’un Flow pour assister à la prise en main, le plein potentiel de Tale of Data deviendra visible avec la pratique.

Créer le flow

Dans l’écran d’accueil :

  1. Appuyez sur le bouton « Nouveau Flow ».

starter-image14

  1. Nommez le Flow. Par exemple : « Mon premier Flow »

starter-image15

  1. Appuyez sur « Valider ».

  2. Vous arrivez sur l’interface du Flow Designer.

starter-image16

Le Flow Designer

starter-image21

starter-image17 Barre d’outils

(à partir de laquelle il est possible de glisser-déposer des nœuds dans le canevas).

starter-image18 Canevas

(sur lequel l’utilisateur compose son Flow).

starter-image19 Zone de configuration

(pour saisir et sélectionner les paramètres des nœuds utilisés dans le Flow).

starter-image20 Zone de prévisualisation

(pour visionner les données d’entrée et de sortie du nœud sélectionné dans le Flow).

Note

Le nœud préparation starter-image25 est le seul nœud qui se configurera dans une autre interface.

Indication

Cette prévisualisation est partielle. En effet, elle n’est appliquée qu’à un échantillon de lignes.

Ajouter une source de données

Faites un glisser-déposer de l’icône du nœud source starter-image27 de la barre d’outils sur le canevas.

starter-image28

Un nœud source starter-image29 permet de récupérer des enregistrements (en se connectant à des fichiers ou à des bases de données).

Configurer le nœud source

  1. Vous pouvez éventuellement nommer votre nœud source starter-image30.

    Par exemple : « Ma Source de données »

    Si vous ne le faites pas, le nœud prendra automatiquement le nom du fichier ou de la table sélectionné.

  2. Sélectionnez dans le champ « Type de Source de Données » : Système de fichiers Tale of Data.

    starter-image31

    Note

    Le champ « Sources de Données existantes » est complété automatiquement.

  3. Appuyez sur le bouton « Sélectionner ».

    starter-image32

    Une nouvelle fenêtre apparaît.

    starter-image33

  4. Dans la partie « Téléverser des fichiers », appuyez sur le bouton « Sélectionner les fichiers ».

    starter-image34

  5. Importez le fichier de démonstration fourni avec le guide de démarrage (My_Data.csv).

    Dans la partie « Sélection d’un fichier », le fichier est visible.

    starter-image35

  6. Cliquez sur le fichier « My_Data.csv » pour le sélectionner.

    starter-image36

    Le bouton « Sélectionner » devient coloré et donc actif.

  7. Appuyez sur le bouton « Sélectionner ».

    L’interface Flow Designer réapparaît avec votre nœud source starter-image37 configuré.

    starter-image38

Note

L’icône starter-image39 indique que la source n’est pas encore prête à être utilisée. En effet, elle doit être liée à un nœud cible starter-image40.

Note

Un aperçu des données du fichier importé est affiché dans la zone de prévisualisation en bas de l’écran.

Ajouter une cible pour les données

Faites un glisser-déposer de l’icône du nœud cible starter-image41 de la barre d’outils dans le canevas à côté du nœud source starter-image42.

starter-image43

Un nœud cible starter-image44 permet d’envoyer des enregistrements vers un système de stockage.

Configurer le nœud cible

  1. Vous pouvez éventuellement nommer votre nœud cible starter-image45.

    Par exemple : « Données traitées »

    Si vous ne le faites pas, le nœud prendra automatiquement le nom du fichier ou de la table sélectionné.

  2. Sélectionnez dans le champ « Type de Source de Données » : Système de fichiers Tale of Data.

    starter-image46

    Note

    Le champ « Sources de Données existantes » est complété automatiquement.

  3. Dans la liste déroulante du champ « Types de fichier », sélectionnez « XLSX (à partir d’Excel 2007) ».

    starter-image47

    Important

    La barre orange indique qu’il faut cliquer sur le bouton « Appliquer » pour sauvegarder la configuration du nœud.

    Si vous ne cliquez pas sur le bouton « Appliquer », la configuration du nœud sera perdue.

Une nouvelle partie de la zone de configuration apparaît.

starter-image48

  1. Dans la partie « Options Excel (XLSX) », appuyez sur le bouton « Sélectionner ».

    Une nouvelle fenêtre apparaît.

  2. Dans la partie « Fichier de Sortie » remplissez les 2 champs :

    • « Nom du Fichier », nom qui sera attribué au fichier Excel,

      Par exemple : « Données Traitées »

    • « Nom de la feuille », nom de la feuille de calcul où seront stockées les données.

      Par exemple : « Feuille_1 »

    starter-image49

    Important

    Il est nécessaire de sortir des champs de saisie pour rendre le bouton « Sélectionner » actif.

    Après avoir rempli et être sorti du champ « Nom de la feuille », le bouton se colore et devient actif.

  3. Appuyez sur le bouton « Sélectionner ».

    L’interface Flow Designer réapparaît avec votre nœud cible starter-image50 configuré.

    starter-image51

Note

L’icône starter-image52 indique que la cible n’est pas encore prête à être utilisée. En effet, elle doit être liée à un nœud source starter-image53.

Mode de sauvegarde

Ecraser (Overwrite)

pour écraser la table ou le fichier à chaque exécution du flow.

Ajouter (Append)

pour ajouter les enregistrements à la fin d’une table ou d’un fichier existant.

Créer (Create)

pour créer une nouvelle table ou un nouveau fichier. Dans ce cas une erreur se produira si la table (ou le fichier) existe déjà.

Note

Il peut exister d’autres modes, suivant le type de connecteur utilisé. Les trois modes listés ici sont communs à quasiment tous les connecteurs Tale of Data et sont les plus utilisés.

Relier les nœuds

Pour créer un lien entre deux items du Flow :

  1. Cliquez sur le nœud source starter-image54.

  2. Faites glisser la souris vers le nœud cible starter-image55 en maintenant le bouton gauche de la souris enfoncé.

    Note

    Une icône de flèche doit apparaître starter-image56.

  3. Relâchez le bouton gauche de la souris une fois au-dessus du nœud cible starter-image57.

    starter-image58

    Vous avez créé le lien entre les deux nœuds.

    starter-image59

Note

La bulle avec le point d’exclamation a disparu : le lien est valide et les nœuds sont prêts à être utilisés.

Ajouter un nœud filtre

Nous souhaitons filtrer les lignes provenant du fichier d’entrée, et ne conserver que les lignes pour lesquelles les entrées de la colonne « Pays » sont « France ». Pour cela nous allons introduire un noeud filtre starter-image60 dans notre flow, comme intermédiaire entre les données d’entrée et les données de sortie.

  1. Faites un glisser-déposer de l’icône du nœud filtre starter-image60 sur le lien qui relie le nœud source starter-image61 et le nœud cible starter-image62.

    starter-image63

    Un nœud filtre starter-image64 permet de réaliser un filtrage de vos données.

    Le nœud filtre starter-image65 est intégré au Flow.

    starter-image66

    Note

    Il est tout à fait possible de construire le Flow de gauche à droite : nœud cible starter-image67, puis nœud filtre starter-image68 et enfin nœud source starter-image69.

Configurer le nœud filtre

  1. Dans la partie Prédicats, accédez à la liste déroulante en cliquant sur la flèche.

    starter-image71

    Le contenu de la liste déroulante est généré en fonction du fichier chargé.

  2. Sélectionnez « Pays ». Deux nouveaux champs apparaissent.

    starter-image72

  3. Dans le champ vide, saisissez la valeur « France ». Avec la condition « equal to » (qui signifie « est égal à »), le filtre sera sera sensible à la casse de la valeur saisie (minuscule, majuscule).

    starter-image73

  4. Appuyez sur le bouton « Appliquer ».

    Un aperçu des données filtrées s’affiche dans la zone de prévisualisation en bas de l’écran.

    starter-image74

Note

Après avoir cliqué sur le nœud cible starter-image75, ce dernier semble contenir les résultats escomptés mais ce n’est qu’un échantillon.

Il faudra exécuter le Flow pour que le filtrage soit bien appliqué sur tout le jeu de données.

Indication

Il est possible de nommer le filtre, avec le champ « Nom ».

Ceci aide à documenter le flow; si vous choisissez un nom particulier, celui-ci apparaîtra dans la documentation du PDF flow lorsque celle-ci sera produite (la documentation détaille le fonctionnement du flow de façon lisible).

starter-image70

Exécuter le Flow

Pour pouvoir récupérer les résultats de ce traitement (le Flow), nous allons l’exécuter.

  1. Appuyez sur le bouton « Exécuter » situé à droite dans la barre d’outils.

    starter-image76

  2. La fenêtre de planification apparaît.

    Appuyez sur le bouton « Exécuter maintenant ».

    starter-image77

    Vous pouvez observer un message de réussite de la planification starter-image78 et de l’exécution starter-image79 du Flow.

    starter-image80

starter-image81

Félicitations, vous venez de créer et d’exécuter votre premier Flow !

Télécharger les résultats

Maintenant nous souhaitons récupérer le résultat produit par l’exécution de ce flow.

  1. Cliquez sur le nœud cible starter-image82 pour le sélectionner.

    starter-image83

    Le bouton « Télécharger » starter-image84 est visible.

  2. Cliquez sur le bouton starter-image85 pour télécharger le fichier.

Comparer les fichiers avant et après le traitement

Vous pouvez effectuer une comparaison du fichier source avec le fichier cible.

Fichier source « My_Data »

starter-image86

Fichier cible « Mes données traitées »

starter-image87

Note

Ce premier Flow est un exemple d’introduction : des traitements beaucoup plus élaborés (mais simples d’utilisation) sont disponibles.

Il est par exemple possible de :

  • Exécuter le même traitement sur d’autres données sans refaire le Flow (= réutilisation des Flows)

  • Planifier les exécutions (quotidiennes, hebdomadaires, etc.)

  • Traiter de très grosses volumétries de données (milliards de lignes)

  • Lancer des alertes paramétrables sur tous types d’anomalies présentes dans les données.

Pour aller plus loin

Gérer ses Flows

starter-image88

Vous pouvez observer que votre Flow apparaît maintenant dans la partie « Mes Flows récents » de l’écran d’accueil.

  1. Appuyez sur « Voir tous mes Flows ».

    starter-image89

  2. Sélectionnez le Flow que vous souhaitez modifier (en cochant la case).

starter-image95

starter-image90 Ouvrir le Flow

starter-image91 Renommer le Flow

starter-image92 Dupliquer le Flow

starter-image93 Supprimer le Flow

starter-image94 Partager le Flow

Astuce

Vous pouvez, par exemple, renommer ou supprimer vos Flows depuis cette interface grâce à la barre latérale.

Récapitulatif de la palette des nœuds de traitement de la barre d’outils

Le guide de référence permet de trouver des informations détaillées sur chacun des outils de traitement de Tale of Data. Voici un récapitulatif en bref:

node-list-s-image25 Fonction de préparation

Une fonction de préparation permet d’appliquer une série de transformations aux données d’entrée, en puisant dans une palette d’une centaine de types d’opérations possibles, comme par exemple formater, redresser, dédoublonner, harmoniser, enrichir, poser et appliquer des règles de validation.

node-list-s-image4 Filtre

Un nœud filtre permet de sélectionner les champs et les enregistrements à envoyer sur chacune de ses sorties.

node-list-s-image102 Validation

Un nœud de validation envoie les enregistrements valides sur sa 1ère sortie et les enregistrements invalides sur sa 2ème sortie, s’il en a une.

node-list-s-image96 Diffusion

Un nœud de diffusion permet de dupliquer chaque enregistrement (entrées) sur toutes les sorties.

node-list-s-image98 Jointure

Un nœud de jointure permet d’ajouter des informations à une donnée, correspondant à un ajout de colonnes (jointure au sens SQL).

node-list-s-image99 Enrichissement

Un nœud d’enrichissement permet, notamment en utilisant du matching flou, d’ajouter de nouveaux champs à un jeu de données (dit jeu de données à enrichir ou jeu de données n°1) à partir d’un jeu de données d’enrichissement (= jeu de données n°2, connecté par un lien bleu).

node-list-s-image97 Union

Un nœud d’union permet d’ajouter plusieurs jeux de données en entrée (empilement), correspondant à un ajout de lignes (union au sens SQL).

node-list-s-image101 Tri

Un nœud de tri permet de trier les enregistrements en entrée selon différents critères.

node-list-s-image100 Agrégation

Un nœud d’agrégation permet de créer des tableaux croisés.

node-list-i512 Fonction fenêtre

Une fonction fenêtre permet d’effectuer, pour chaque ligne du jeu de données d’entrée, un ou des calculs sur un ensemble d’enregistrements qui sont liés à l’enregistrement courant du jeu de données d’entrée.

node-list-i159 Référentiel

Les référentiels permettent de réparer ou d’enrichir des jeux de données avec des algorithmes de matching sophistiqués.