Tri d’une liste insensible à la casse

Description du Problème :

Comment puis-je trier une liste de chaînes de caractères en ignorant la casse et les accents ?

Solution :

Le tri effectué par ToD est généraliste et la politique de tri est la même pour toutes les colonnes de type texte. Les caractères sont donc triés selon leur code dans l’encodage de la plateforme.

Pour l’alphabet occidental, les codes sont les suivants :

image1

Il est donc nécessaire de faire une préparation afin d’obtenir un tri particulier dans ToD. Pour notre exemple, le but est de créer une copie de la colonne ciblée, avec ses valeurs mais en minuscules et sans accents, puis de trier le tout :

image2

La transformation effectuée dans l’éditeur de préparation est “IA générative pour transformer des données” avec pour instruction : Créer une nouvelle colonne ayant les valeurs de la colonne "name" de type TEXTE, de manière à ce que la nouvelle colonne soit une copie de celle-ci sans accents et avec les valeurs en minuscules

image3

Un nœud de tri a ensuite été rajouté, en utilisant la nouvelle colonne “normalized_name” comme champ de tri.

image4