Travailler avec des données dans Excel peut être relativement simple, mais ce peut aussi être difficile et chronophage, en particulier si vous utilisez plusieurs sources et formats de données. Il faut les faire tenir dans des lignes et des colonnes, et s’adapter aux limitations de taille. Fusionner des données de plusieurs feuilles de calcul nécessite des formules complexes, ce qui peut entraîner des erreurs dans les résultats. En outre, lorsque les données changent, vous devez refaire chaque étape de la préparation et de la fusion.
Alteryx adopte une approche différente, basée sur les workflows, qui permet de préparer, fusionner et analyser les données de plusieurs sources, y compris les données non structurées. Et comme vous passez du temps à construire un workflow reproductible qui documente exactement votre façon d’utiliser les données, il suffit ensuite de réexécuter le workflow chaque fois que les données changent : ainsi, l’analyse est accélérée, le risque d’erreur est moindre et la cohérence est renforcée.
Pour en savoir plus sur ce qu’apporte Alteryx aux utilisateurs d’Excel, consultez cet e-book sur la maîtrise de l’analytique des données pour les utilisateurs de feuilles de calcul. Ensuite, téléchargez une version d’essai gratuite d’Alteryx.
Pour ouvrir le fichier dans Excel, cliquez sur Fichier, puis sur Ouvrir.
Pour accéder aux données dans Alteryx, faites glisser un outil Entrée de données dans l’espace de travail, localisez la base de données, puis sélectionnez-la. Ensuite, cliquez sur la liste déroulante Connecter un fichier ou une base de données dans la section Configuration.
Localisez le dossier dans lequel se trouve le fichier, puis cliquez dessus pour l’ouvrir.
Ensuite, recherchez l’emplacement du fichier.
Excel peut ouvrir une quantité limitée de données structurées depuis les fichiers locaux.
Alteryx offre un vaste choix aux utilisateurs pour accéder aux données de multiples sources et structures de données. L’outil Entrée leur permet d’accéder en local aux données Excel, Access, XML, SAS, SPSS, MapInfo, ainsi qu’aux données stockées dans des bases de données ou des systèmes HDFS.
Alteryx comprend aussi des connecteurs directs permettant d’accéder aux données stockées dans un système cloud comme Amazon S3, Twitter, Foursquare, Marketo, Salesforce et Microsoft Sharepoint, ou dans d’autres environnements Big Data comme Amazon Redshift, Impala, Spark, etc.
Vous pouvez utiliser d’autres types, sources et structures de fichier en accédant à des données du Web et de fichiers texte, ainsi qu’à de nombreuses autres sources de données.
Dans Excel, si un dossier contient plusieurs fichiers de même type (.CSV, par exemple), vous devez en sélectionner un à la fois. Chaque fichier s’ouvre alors dans une feuille de calcul distincte.
Dans Alteryx, faites glisser un outil Entrée dans l’espace de travail, localisez le dossier, puis insérez un caractère générique (*). Dans cet exemple, nous utilisons deux fichiers .CSV.
Avec l’outil Entrée, localisez le répertoire et le fichier souhaités. Dans cet exemple, il s’agit de POS_Data.
Une fois le fichier POS_Data ajouté, passez dans la section Configuration et modifiez le chemin du répertoire en ajoutant ceci : (_*.csv). Cela permet d’ajouter tous les fichiers .CSV d’un même répertoire et de les réunir s’ils ont la même structure de table et le même format.
Il est très facile et rapide de changer les noms de colonne dans Excel. Cliquez simplement dans la cellule et tapez un autre nom.
Dans Alteryx, c’est très simple aussi. Utilisez l’outil Sélectionner pour changer le nom.
Pour qu’Excel considère les nombres comme des chaînes, vous pouvez ajouter une apostrophe (‘) devant ces valeurs. Vous pouvez aussi sélectionner les cellules ou les colonnes, puis utiliser le menu contextuel « Format de cellule » pour afficher et utiliser d’autres types de formats par exemple pour les devises, les dates, etc.
Dans Alteryx, l’outil Sélectionner permet de changer le type de données pour utiliser le format de votre choix.
Outre l‘outil Sélectionner, vous pouvez utiliser l‘outil Champ automatique. Comme son nom l’indique, cet outil est capable d’interpréter les données et de leur attribuer le type et la taille appropriés selon le contenu. C’est particulièrement utile pour les champs qui contiennent des chaînes de texte.
Certaines conversions sont un peu plus complexes. Les dates peuvent poser des problèmes : en effet, l’outil Sélectionner n’est pas forcément capable de comprendre quel est votre format de date préféré. C’est pour cette raison que l’outil DateHeure existe.
Pour supprimer une colonne utilisée dans un champ calculé, vous devez d’abord copier et coller les valeurs avant de supprimer celles d’origine, sinon votre formule ne fonctionnera plus.
Dans Alteryx, cette opération est simple. Utilisez simplement l’outil Sélectionner et désactivez la case à cocher de l’élément dont vous n’avez pas besoin ou que vous voulez masquer. Il disparaît alors de votre workflow sans que cela perturbe les formules.
Vous pouvez effectuer une sélection manuelle dans Excel, ou utiliser un filtre rapide pour rechercher ce dont vous n’avez pas besoin.
Si vous pouvez répertorier les critères, il est possible d’utiliser l’outil Filtrer. Si c’est compliqué, vous pouvez utiliser une formule pour créer des expressions conditionnelles ou utiliser la fonction Switch ().
En général, pour créer des champs dans Excel, vous insérez une nouvelle colonne, lui attribuez un nom, puis créez une formule si besoin.
Dans Alteryx, au lieu d’insérer une colonne dans la table, il suffit d’ajouter un nouveau champ de sortie à votre workflow en utilisant l’outil Formule. Tapez simplement le nouveau champ (Value Targets en l’occurrence) ; le nouveau champ est calculé sur chaque
ligne.
Conseil 1 : si vous devez concaténer le prénom et le nom de famille, utilisez une formule avec le symbole +. La plupart des autres formules basées sur du texte utilisent le même nom et la même syntaxe, par exemple Left () ou Right (). Consultez la documentation Alteryx (appuyez sur F1) pour connaître les exceptions à cette règle.
Conseil 2 : si vous fractionnez un champ ayant un format normal (par exemple, un champ d’adresse avec des valeurs séparées par des virgules), utilisez l’outil Texte en colonnes.
Tout le monde utilise des instructions conditionnelles dans Excel. C’est l’une des fonctions de prise de décision les plus populaires de la plateforme. Pour créer une colonne Sales Potential qui attribue les scores High, Medium ou Low, vous utilisez cette instruction IF suivante dans Excel
=IF(V2>2500, “High”, IF(V2>1499, “Medium”, “Low”))
L’outil Formule est un puissant processeur de données et de formules. Utilisez-le pour ajouter un champ à une table d’entrée, créer des champs de données en fonction d’une expression ou d’une relation de données ou actualiser un champ existant en fonction de ces mêmes éléments. Pour créer la même instruction conditionnelle dans Alteryx, ajoutez simplement un nouveau champ de sortie appelé Sales Potential, puis en utilisant le champ Total Sales, entrez l’expression suivante :
IF [Total Sales] > 2500 THEN “High” ELSEIF [Total Sales] > 1499 && [Total Sales] < 2501 THEN “Medium” ELSE “Low” ENDIF
Pour créer une somme automatique dans Excel, il faut sélectionner les champs et les lignes Excel, puis cliquer sur le symbole Somme automatique. Vous pouvez aussi créer une formule =SUM (=SOMME dans la version localisée).
L’outil Agréger permet d’effectuer différentes opérations d’agrégation, traitement des objets géographiques, concaténation de chaînes, etc. Dans cet exemple, l’outil Agréger permet de regrouper des transactions par client et de totaliser les transactions afin de voir le montant total des dépenses du client.
Pour créer la somme cumulée des lignes dans Excel, vous devez créer une nouvelle colonne, puis définir la plage cumulative. Dans cet exemple, le point de départ est =S2, et vous ajoutez =S2 + R3 pour la seconde ligne. Ensuite, vous pouvez copier la formule pour le reste des informations connexes.
L’outil Formule à plusieurs lignes reprend le concept de l’outil Formule en l’étendant pour permettre d’utiliser les données des lignes lors de la création de la formule. Cet outil est pratique pour analyser la syntaxe des données complexes et créer des totaux, des moyennes, des pourcentages et d’autres calculs mathématiques cumulés. Dans cet exemple, vous créez un nouveau champ, puis une expression.
Dans Excel, pour calculer des pourcentages sur chaque champ en fonction d’un total, vous devrez peut-être créer d’abord une table avec vos données, puis un tableau croisé dynamique en fonction de ces données. L’autre option consiste à utiliser une instruction SUMIF() pour calculer le pourcentage de chaque mois et chaque montant. Voyez ci-dessous un exemple de tableau croisé dynamique.
The L’outil Formule à plusieurs champs facilite l’exécution d’une seule fonction sur plusieurs champs. Cet exemple crée des colonnes/champs dans les données pour afficher un pourcentage pour chaque mois.
Le filtrage des données est facile dans Excel. Sélectionnez simplement la feuille de calcul ou les colonnes à filtrer, puis ouvrez la liste déroulante Filtrer.
Dans Alteryx, l’outil Filtrer permet d’effectuer un filtrage de base pour séparer les données en deux flux : True (les données correspondent à l’expression) ou False (les données ne correspondent pas).
Le tri en fonction de plusieurs colonnes dans Excel est simple. Sélectionnez simplement la feuille de calcul et exécutez un tri ou un tri personnalisé.
Dans Alteryx, l’outil Trier fonctionne tout aussi simplement et vous permet d’organiser les données exactement comme vous le souhaitez. Sélectionnez le nom de la colonne et choisissez le tri croissant ou décroissant.
Pour faire pivoter des données dans Excel (par exemple les transposer ou créer un tableau croisé), il faut créer un tableau croisé dynamique pour organiser les données comme vous le souhaitez.
L’outil Transposer vous permet de faire pivoter la table de données. Il transforme les données pour que vous puissiez voir les champs de données horizontaux sur un axe vertical. Cet outil est pratique pour extraire les données non conformes. Vous pouvez transposer autant d’enregistrements ou de champs que vous voulez
L’outil Tableau croisé dynamique change l’orientation de la table de données. Il transforme les données pour montrer les champs verticaux sur un axe horizontal en résumant les données là où cela a été spécifié.
Pour réorganiser des colonnes ou des champs dans Excel, il faut les sélectionner, puis utiliser la touche Maj pour les faire glisser et les déposer à l’endroit voulu.
Pour réorganiser des colonnes dans Alteryx, utilisez l’outil Sélectionner ou l’outil Formule.
Dans Excel, vous devez vérifier que les colonnes des deux tables sont absolument identiques et dans le même ordre. Vous copiez ensuite l’intégralité du contenu de la deuxième table et vous le collez dans la première ligne vide de la première table.
Cette opération est très simple dans Alteryx. L’outil Union vous permet de combiner plusieurs feuilles de calcul en fonction des noms de champ tout en conservant la position de chaque colonne. Vous pouvez aisément changer l’ordre des en-têtes de colonne dans chaque feuille de calcul pour qu’ils correspondent
Pour réunir plusieurs feuilles de calcul dans Excel, vous pouvez utiliser la formule VLOOKUP ou INDEX MATCH afin d’ajouter des informations dans les jeux de données à partir d’une ou de plusieurs sources ou tables différentes. La formule INDEX MATCH est utilisée à la place de. la formule VLOOKUP si la valeur recherchée ne se trouve pas dans la colonne la plus à gauche. Cela signifie que vous ne pouvez pas utiliser la formule VLOOKUP.
Si plusieurs correspondances doivent avoir leurs propres lignes, une jointure est plus appropriée. Vous pouvez utiliser deux jeux de données en entrée et les réunir avec l’outil Jointure. Si vous vous connectez à une source de données compatible, vous pouvez les joindre dans l’outil Entrée.
L’outil Jointure permet de réunir deux tables ayant un champ commun (clé primaire) pour créer les éléments suivants :
Vous pouvez également utiliser l’outil Rejoindre en BDD si vous travaillez avec les données d’une base de données. Dans Alteryx, l’outil Rejoindre en BDD permet de fusionner et d’analyser` les données par rapport à des jeux de données volumineux sans sortir les données de la base de données. Il améliore sensiblement les performances par rapport aux méthodes d’analyse traditionnelles.
L’outil Rejoindre en BDD permet d’effectuer des jointures internes, gauches, droites et même des jointures complètes.
Pour en savoir plus sur les outils En base de données d’Alteryx, cliquez ici.
Pour agréger des données dans Excel, créez un tableau croisé dynamique.
Dans Alteryx, l’outil Agréger Alteryx fonctionne comme un tableau croisé dynamique dans Excel. Vous pouvez regrouper des données, additionner, compter ou exécuter d’autres calculs sur d’autres champs.
Si vous n’avez pas encore téléchargé Alteryx, obtenez une version d’essai gratuite.
Pour en savoir plus ou obtenir de l’aide sur d’autres fonctions d’Alteryx grâce aux utilisateurs d’Alteryx, visitez la Communauté Alteryx.
Nous remercions tout spécialement notre partenaire Information Lab pour sa contribution. Pour en savoir plus sur Information Lab, cliquez ici.