Guides produit

Le guide Alteryx
pour les utilisateurs SQL

L'approche traditionnelle de l'accès aux données et de leur préparation implique parfois des tâches chronophages pour les analystes. Frustrés, certains prennent les choses en main et se lancent dans l'apprentissage de la programmation SQL plutôt que de dépendre de l'IT et des développeurs SQL. L'une des principales difficultés de la programmation SQL, c'est de faire en sorte que le code fonctionne ! La correction automatique n'existe pas dans SQL : si vous placez un point ou une virgule au mauvais endroit, l'erreur ne sera pas détectée automatiquement et provoquera l'échec du script.

Alteryx adopte une approche différente, basée sur les workflows, qui permet de préparer, de fusionner et d'analyser les données de plusieurs sources, y compris les données non structurées. Au lieu de passer votre temps à tester et déboguer le code, vous créez un workflow reproductible qui montre précisément à vos collègues, aux autres analystes, à l'IT et aux décideurs comment vous avez extrait et transformé les données. Le résultat ? Moins de temps passé à coder, et plus de transparence et de cohérence.

Nous avons répertorié certains des processus les plus courants que beaucoup d'analystes codent en SQL. Nous expliquons comment faire la même chose avec Alteryx. Ces exemples visent à aider les analystes qui écrivent du code SQL à exploiter leurs connaissances SQL pour créer un workflow Alteryx.

Pour en savoir plus sur ce qu'apporte Alteryx aux codeurs SQL, téléchargez le livre blanc Enabling Self-Service Data Analytics: 5 Ways Alteryx Helps SQL Users. Ensuite, essayez par vous-même grâce à une version d'évaluation gratuite d'Alteryx valable 14 jours.

Select

SELECT, FROM, WHERE, GROUP BY, HAVING, ORDER BY

SQL
Alteryx

écran sql

 

 

Outil Entrée de données d'Alteryx   Pour accéder aux données dans Alteryx, faites glisser un outil Entrée de données dans l'espace de travail, localisez la base de données, puis sélectionnez-la.

Dans cet exemple, l'outil Entrée de données vous permet de vous connecter à une base de données SQL Server.

 

configuration des données d'entrée alteryx

Alteryx : outil Sélection  L'outil Sélection vous permet de changer le type de données, de sélectionner/désélectionner des champs ou de renommer simplement les champs comme vous le souhaitez. Dans cet exemple, CustomerID est le nom du champ.  

écran de sélection alteryx

écran sql

outil jointure alteryx  Dans Alteryx, l'outil Jointure permet de combiner facilement plusieurs ensembles de données.  

L'outil Jointure vous permet de réunir deux tables ayant un champ commun (clé primaire), et Alteryx renvoie automatiquement trois ensembles d'enregistrements :

  • Jointure interne (J) : colonnes de la table source (L) combinées avec les colonnes de la table à joindre (R), en faisant correspondre les enregistrements en fonction du ou des champs communs
  • Gauche sans jointure (L) : enregistrements de la table d'origine (L) pour lesquels il n'existe pas de correspondance dans la table à joindre (R)
  • Droite sans jointure (R) : enregistrements de la table à joindre (R) pour lesquels il n'existe pas de correspondance dans la table source (L)


Voici une jointure sur l'ID client. 

écran jointure alteryx


Outil Verrouiller la jointure dans Alteryx  Outre l'outil Jointure, Alteryx dispose également d'un outil Rejoindre en base de données. Celui-ci permet de fusionner et d'analyser les données par rapport à des ensembles de données volumineux sans sortir les données de la base de données. Il améliore sensiblement les performances par rapport aux méthodes d'analyse traditionnelles.  

L'outil Rejoindre en base de données permet d'effectuer des jointures internes, des jointures externes gauches, des jointures externes droites et des jointures externes complètes.

Pour en savoir plus sur les outils En base de données d'Alteryx, cliquez ici.


Outil Union Alteryx   L'outil Union permet de combiner plusieurs ensembles d'enregistrements en fonction du nom du champ ou de la position de chaque colonne. Vous pouvez changer aisément l'ordre des en-têtes de colonne dans chaque ensemble d'enregistrements pour qu'ils correspondent.

Ici, deux ensembles d'enregistrements, à savoir les enregistrements gauches non joints et les enregistrements joints (internes), ont été rassemblés pour produire une jointure externe gauche.

écran union alteryx

configuration de l'outil union alteryx

écran sql

Outil Filtrer   L'outil Filtrer permet de limiter les enregistrements en fonction de critères spécifiques. Le filtrage peut utiliser aussi bien des comparaisons simples que des instructions conditionnelles complexes. Dans cet exemple, seuls les enregistrements qui ne contiennent pas le pays États-Unis sont filtrés. 

écran filtrer

écran sql

Outil Synthèse   Dans Alteryx, l'outil Synthèse vous permet de collecter des données dans plusieurs enregistrements, d'appliquer une fonction d'agrégation et de regrouper les résultats en fonction d'un ou plusieurs champs.

Dans cet exemple, l'outil Synthèse est utilisé pour regrouper en fonction du pays (par exemple, Royaume-Uni, Allemagne) et calculer la moyenne du montant total par pays. 

écran de configuration synthèse

Outil Filtrer   L'outil Filtrer permet de limiter les enregistrements en fonction de critères spécifiques. Le filtrage peut utiliser aussi bien des comparaisons simples tout au long du processus que des instructions conditionnelles complexes. Dans cet exemple, seuls les enregistrements dont la moyenne des totaux est supérieure ou égale à 1 000 apparaissent.

écran filtrer 2

configuation complète sql

Outil Trier   L'outil Trier d'Alteryx permet d'organiser les données comme vous l'entendez. Sélectionnez le ou les noms de la ou des colonnes et choisissez le tri croissant ou décroissant. Dans cet exemple, le montant moyen total est affiché par ordre décroissant.

configuration de tri alteryx

workflow complet dans alteryx

Il s'agit du workflow Alteryx complet pour l'instruction SQL SELECT.

Cross Join

Cross Join

SQL
Alteryx

écran sql

Outil Ajouter des champs   L'outil Ajouter des champs permet d'ajouter les champs d'une entrée source à chaque enregistrement d'une entrée cible. Chaque enregistrement de l'entrée cible sera dupliqué pour chaque enregistrement de l'entrée source. Ici, tous les enregistrements Distribution Center sont annexés à chaque enregistrement Customer. 

écran Ajouter des champs

utilisation de la jointure croisée alteryx

Ce workflow Alteryx ajoute les enregistrements Distribution Center à chaque enregistrement Customer.

Where Between

Where Between

SQL
Alteryx

écran sql

Outil Filtrer   L'outil Filtrer d'Alteryx permet de limiter les enregistrements à ceux dont les valeurs des champs sont comprises dans une plage spécifique. Dans cet exemple, seules les dates de commande comprises entre le 1er et le 31 décembre 2016 inclus sont filtrées.  

écran filtrer

where between dans alteryx

Ce workflow Alteryx filtre les données des commandes situées entre le 1er et le 31 décembre 2016.

Where In

Where In

SQL
Alteryx

écran sql

Outil Filtrer   Utilisez l'outil Filtrer d'Alteryx pour limiter les enregistrements à ceux dont les valeurs des champs appartiennent à un ensemble d'alternatives possibles. Dans cet exemple, Alteryx filtre les clients dont le pays est soit États-Unis, soit Royaume-Uni.

écran sql

alteryx wherein

Ce workflow Alteryx filtre les clients dont le pays est soit États-Unis, soit Royaume-Uni.

Distinct

Distinct

SQL
Alteryx

écran sql

Outil Union Alteryx   L'outil Unique d'Alteryx permet de séparer les données en deux flux, enregistrements en double et uniques, en fonction des champs que vous avez choisis. Le champ sélectionné dans cet exemple est celui des pays.

sélection du pays dans alteryx

distinct dans alteryx

Avec l'outil Unique, ce workflow Alteryx sépare les données en deux flux (enregistrements en double et uniques) en fonction des champs que vous choisissez (celui des pays dans cet exemple).