Blogs universels

Six nouvelles façons de voir au-delà des lignes et des colonnes

La déconstruction des données : un processus repensé

Des difficultés aux possibilités, passer des feuilles de calcul aux workflows améliore non seulement votre journée de travail, mais également votre carrière et la façon dont vous abordez le mouvement Data. Chaque avancée vous paraîtra-t-elle redoutable ou percevrez-vous le rôle unique que vous pouvez jouer dans cette transformation numérique ?

Découvrez quelques-unes des tâches les plus courantes qui sont réalisées dans des feuilles de calcul et qui peuvent être transformées grâce à l'analytique moderne. Découvrez six nouvelles façons de voir au-delà des lignes et des colonnes et de mieux y voir dans les feuilles de calcul

1 : ENTRÉE 

Toutes les sources de données ne pourraient-elles pas juste bien s'entendre ?

La vie d'un analyste de données devrait être paisible. Après tout, vous êtes payé pour dénicher de précieux insights dans une montagne de données et vous êtes le premier à vous retrousser les manches pour vous mettre à creuser. Vous commencez par ouvrir des jeux de données. Puis, vous en ouvrez d'autres, qui peuvent provenir d'une source ou d'un programme différent, surtout si les données sont issues de divers services.

Et c'est là que ça commence à se compliquer. Ce n'est pas facile d'ajouter des données ayant divers formats dans des feuilles de calcul, c'est le moins que l'on puisse dire. Il va falloir batailler un peu pour obtenir un jeu de données convenable. Bon, finalement ce n'est pas si paisible que ça…

Par ailleurs, alors que vous êtes en train d'incorporer des données, plusieurs inquiétudes vous taraudent. Suis-je en train d'ajouter des informations inutiles ou qui existent déjà ? Est-ce qu'il va me manquer quelque chose dans tous ces fichiers ? Est-ce que je vais devoir exclure complètement des informations importantes parce qu'elles ne sont pas compatibles avec mon jeu de données ?

Tous les analystes doivent composer avec des silos de données, où l'information se retrouve piégée dans des formats inutilisables et des services cloisonnés. Ils se mettent alors à rêver d'un monde idéal : une normalisation des données harmonieuse, où toutes les données seraient organisées d'une façon logique et cohérente.
Chez l'un des principaux prestataires de santé américains, Thomas Hall travaille en étroite collaboration avec plusieurs équipes afin d'analyser les tendances et les performances et de créer des rapports automatisés. Découvrez comment le consortium est passé des feuilles de calcul aux workflows.

Les jeux de données peuvent tout à fait cohabiter pacifiquement.

Il existe un moyen plus simple de créer et de normaliser un jeu de données, même si vous utilisez des formats de fichiers, des connexions de base de données ou des banques de données cloud incompatibles. En réalité, il n'y a presque pas de limites aux types de données que vous pouvez exploiter. Vous avez simplement besoin d'un point de départ où tous les formats sont bienvenus et où aucune donnée n'est mise à l'écart.

Dans Alteryx, ce point de départ c'est votre espace de travail. C'est visuel, c'est simple et ça peut vous changer la vie. Il vous suffit de faire glisser un outil Entrée de données et de le déposer dans l'espace de travail, de trouver le jeu de données à importer, puis de le sélectionner.

Petite démo vidéo

Découvrez comment travailler avec les données dans un espace de travail pour mieux vous concentrer sur la recherche d'insights pertinents au lieu de passer votre temps sur des tâches fastidieuses de préparation des données.


S'il vous est déjà arrivé de perdre presque une journée de travail à essayer de faire accepter une source de données par votre solution de feuilles de calcul, vous allez adorer la méthode Alteryx. Des formats ou des structures de fichiers différents ? Alteryx reste imperturbable. Vous pouvez accéder aux données stockées en local dans Excel, Access, XML, SAS, SPSS ou MapInfo, ainsi qu'aux données stockées dans des bases de données ou des systèmes HDFS. 

Alteryx inclut également des connecteurs directs vers des systèmes cloud tels qu'Amazon S3, Twitter, Foursquare, Marketo, Salesforce et Microsoft Sharepoint, et vers d'autres environnements Big Data comme Amazon Redshift, Impala et Spark. 

2 : NETTOYAGE

Nettoyage des données : là où les problèmes commencent.

Ce n'est plus un secret : le nettoyage des données, une tâche fastidieuse, est ce qui prend le plus de temps aux analystes. Lorsque vous arrivez à la partie intéressante, c'est-à-dire l'analyse, vous n'avez plus assez d'énergie ni de temps. Pourtant il faut bien la faire cette analyse ! (Espérons que vous n'avez pas commis d'erreur en chemin.) Est-il normal que le nettoyage des données désorganise autant votre travail ? Ou est-ce simplement dû à la nature des feuilles de calcul ?

Dans une feuille de calcul, le nettoyage des données se fait essentiellement manuellement. L'analyse syntaxique, la création de colonnes, la suppression de lignes et l'élimination des espaces blancs peuvent prendre un temps incroyable. Croyez-nous, nous en savons quelque chose.

Mais ce n'est pas le plus gros problème. Tous ces couper-coller et changements de nom ne sont pas seulement horriblement chronophages. C'est aussi le meilleur moyen de faire des erreurs. Les calculs erronés, les erreurs mentales et les enregistrements en double à ce stade précoce peuvent vous envoyer dans la mauvaise direction pour l'analyse, voire vous obliger à tout reprendre depuis le début.

L'intégrité des données devrait être votre principale préoccupation à l'étape du nettoyage. Vous devez être sûr de la justesse et de la cohérence des données, où que vous les déplaciez ou quels que soient vos changements sur leur format. Vous devez également vous assurer que les données ne perdent pas accidentellement du sens lorsque vous y remettez de l'ordre.
C'est le moment de passer à la pratique ! Relevez le Weekly Challenge n° 19 : Excel Record Locator.

Il est temps de reconsidérer l'approche manuelle.

Que diriez-vous de passer d'un nombre incalculable de clics abrutissants à une fonction globale pour le nettoyage des données grâce à de meilleurs outils ? Et si à la place d'un millier d'opérations vous pouviez n'en effectuer qu'une ou deux ?

Passer à Alteryx va bouleverser votre quotidien : vous allez passer beaucoup moins de temps à nettoyer vos données. On ne va pas se mentir, ce n'est pas rien.

Avec Alteryx, vous pouvez créer des colonnes, supprimer des lignes et des colonnes, et changer les types de données en une seule étape, laquelle s'applique instantanément à tout votre jeu de données. Vous pouvez également laisser Alteryx interpréter automatiquement vos données en attribuant les types et tailles appropriées selon le contenu. Dans tous les cas, plus besoin de mémoriser et de refaire les mêmes changements manuellement dans plusieurs fichiers. Tout ce que vous avez déjà fait se trouve dans l'historique. Vous n'avez jamais à tout reprendre à zéro si vous vous trompez. (Oui, c'est possible !)

Avec cette approche sophistiquée du nettoyage des données, la presque totalité des processus manuels et des erreurs humaines est éliminée, ce qui vous permet de vous consacrer davantage aux tâches plus importantes.

3 JOINTURE

Ne laissez personne séparer ce que l'analyste a assemblé.

C'est là que ça devient intéressant, ou effrayant, selon la confiance que vous accordez à la fusion et l'ajout de données stockées dans des feuilles de calcul séparées. Réunir des jeux de données implique systématiquement la modification des éléments d'origine. Si vous avez de la chance, vous vous en sortez sans endommager accidentellement votre jeu de données. Sinon, c'est retour à la case départ.

Comme pour la plupart des étapes du traitement des données dans une feuille de calcul, les actions requises pour réunir des ensembles de données sont incroyablement laborieuses. Ces « VLOOKUP » à répétition ont de quoi rendre fou non ?

Le problème avec la fusion de données à l'ancienne, c'est que les feuilles de calcul ne sont pas très accueillantes. Les tableurs reconnaissent uniquement leur format préféré et ne peuvent pas s'en écarter sans que vous interveniez directement avec des outils manuels tels que VLOOKUP ou INDEX MATCH. Une fois que vous commencez à accumuler plusieurs champs et feuilles, les risques d'erreurs explosent.
Plus de 1,9 milliard de boissons Coca-Cola sont consommées chaque jour dans le monde. Coca-Cola utilise Alteryx pour exploiter le potentiel de son déluge de données. Découvrez le témoignage client.

Il existe un meilleur moyen d'effectuer la fusion.

Votre outil ne pourrait-il pas juste fusionner les données sans que vous ayez à vous soucier de leur format ? Et s'il pouvait garder une trace de tout ce qui a été fait pour vous permettre de revenir en arrière et d'annuler des actions ?

Dans Alteryx, un ensemble d'outils très simples (Union, Rechercher et remplacer, Jointure) vous offrent les mêmes fonctionnalités de fusion que votre tableur, mais avec de nouvelles possibilités extraordinaires. Vous ne saviez même pas que vous en aviez besoin. Vous pouvez à tout moment retrouver les étapes précédentes jusqu'à n'importe quel stade du workflow, les reprendre et revenir au point de départ si nécessaire.

Combinez plusieurs feuilles de calcul en fonction d'un nom de champ, en conservant la position de chaque colonne. Changez même l'ordre des colonnes si vous en avez envie. Réunissez deux flux de données ayant un champ en commun grâce à une jointure interne ou externe.

En fait, vous rassemblez les données comme bon vous semble. En déléguant la plus grande partie du travail à Alteryx, vous pouvez vous mettre tout de suite à explorer votre jeu de données d'une manière plus approfondie.

4 : TRANSFORMATION

Avez-vous déjà oublié un filtre dans votre feuille de calcul ? Nous connaissons déjà la réponse.

Pour découvrir le sens profond des données, vous devez les visualiser de la manière qui vous convient le mieux. Avec les feuilles de calcul, vous devez pour cela filtrer, trier et permuter les données juste pour les transposer et les réorganiser exactement comme vous le souhaitez. Ce n'est pas difficile, mais c'est extrêmement manuel et le risque d'erreurs est bien là.

Vous pouvez utiliser votre presse-papiers et annuler des opérations pour revenir à une étape précédente de la transformation des données, mais allez-vous vraiment vous fier à ce processus manuel et hasardeux ?

La transformation des données dans les feuilles de calcul peut être frustrante et prendre beaucoup de temps. Mais ce qui est plus préoccupant, c'est que les champs de données masqués et les filtres oubliés peuvent finir par coûter cher à l'entreprise. À la fin de l'analyse, pouvez-vous vraiment être sûr que rien n'a été perdu en cours de route ? Miseriez-vous votre job là-dessus ?

Le 21e siècle vous appelle.

En effectuant les transformations courantes avec des outils super intelligents, vous pouvez réduire le nombre d'erreurs, et le risque, alors que vous en êtes à la partie la plus intéressante de votre travail.

Les outils Trier, Transposer et Tableau croisé dynamique d'Alteryx vous permettent d'organiser et de redisposer vos données automatiquement. Vous avez ainsi rapidement une idée précise de la situation avant l'analyse. Lorsque vous utilisez ces outils dans vos workflows, vous pouvez toujours revenir en arrière, jusqu'au point de départ, et expliquer les étapes que vous avez suivies. C'est vraiment très appréciable d'être en mesure de décrire la méthodologie employée et de changer de vue à la volée.

Alors, préférez-vous transformer les données dans des feuilles de calcul ou dans des workflows ? Rien à voir, n'est-ce pas ? C'est comme si vous compariez un téléphone à cadran des années 50 qui ne sait faire qu'une seule chose à un tout nouveau smartphone aux innombrables fonctionnalités. Les workflows symbolisent la différence entre un fonctionnement en silos et une structure avec une véritable culture de l'analytique lorsqu'il s'agit d'établir une stratégie avant-gardiste pour la méthodologie des données.
Une grande chaîne de restauration rapide s'engage sur la voie du succès en s'appuyant sur les données. Découvrez son parcours vers la maturité analytique.

5 : CALCUL

Marre des formules ? C'est compréhensible.

Voyons cela de plus près. Les feuilles de calcul sont conçues pour calculer des formules logiques en utilisant des déclarations IF, qui sont faciles à mettre en place. Mais ça se complique lorsque vous appliquez ces formules partout où vous en avez besoin.

Lorsque vous appliquez des formules, vous mémorisez de nombreuses informations, comme ce que vous êtes en train de faire et comment vous êtes arrivé là. Couper et coller des formules commence à sembler un peu rudimentaire. Où avez-vous donc mis cette série de lignes que vous pensiez inutiles ? Avez-vous bien appliqué cette formule partout où elle est nécessaire ? Auriez-vous masqué certaines cellules ? Qu'est-il arrivé à tout ce que vous aviez mis dans le Presse-Papiers ? Est-ce que c'était important ?

Oh la la !

Il vaut mieux ne faire le travail qu'une seule fois non ?

Et si vous pouviez définir une formule une fois pour toutes, avec un seul outil, puis l'appliquer partout sans avoir à vous rappeler ce que vous avez fait avant ?

L'outil Formule d'Alteryx est puissant : en une seule action, vous pouvez ajouter un champ à une table d'entrée et créer ou mettre à jour des champs de données en fonction d'une expression ou d'une relation. Au moindre élément ajouté, soustrait ou modifié, votre workflow montre de quoi il s'agit, et quand et où cela s'est produit. Vous avez donc toujours la possibilité de revenir en arrière et de procéder autrement.

Dans Alteryx, les données, la logique et l'exécution appartiennent à des couches bien distinctes. Cela signifie que vous pouvez prendre le temps de planifier votre logique avant de l'exécuter. De plus, aucune de vos données ne sera endommagée. Si quelque chose change ou si de nouveaux enregistrements sont ajoutés, votre logique est appliquée automatiquement. Vous pouvez donc faire confiance aux résultats que vous obtenez.

La magie de l'analytique en libre-service

  • Des tableaux croisés dynamiques faits manuellement ? Pas question !

  • Des formules manuelles ? Non plus.

  • Une synthèse manuelle ? Sûrement pas.

Passez tout de suite à la phase intéressante de l'analyse.

Voilà une autre inquiétude rayée de la liste ! Ouf, ça va beaucoup mieux.

6 : AGRÉGATION

Tapez-vous aussi vite que vous le pensez ?

Le pouvoir descriptif et prédictif des données réside dans l'agrégation. C'est là que les secrets se révèlent. Mais lorsqu'il faut utiliser des tableaux croisés dynamiques pour faire la synthèse des données dans une feuille de calcul, vous tentez de faire émerger des insights et d'arriver aux résultats en suivant une seule piste. Observer les données sous un seul angle compromet votre agilité et la rigueur de votre travail dans la dernière phase de l'analyse. Cela vous empêche également de trouver des réponses aux questions épineuses que soulève invariablement votre boss.

Et il faut bien dire aussi qu'il n'est pas facile de travailler avec de très grands jeux de données. Votre système n'arrive pas toujours à suivre lorsque vous avez besoin de changer vos paramètres, de déplacer des éléments ou de revenir sur vos hypothèses. Vous vous retrouvez alors devant une roue qui tourne et vous ne pouvez plus rien faire.

La synthèse manuelle des données sera toujours limitée par la vitesse de vos doigts sur le clavier, les capacités de votre tableur et la puissance de votre ordinateur. De plus, vous obtenez seulement des résultats partiels à chaque fois.

Si ces limitations vous font perdre patience alors que vous arrivez à la fin de votre analyse, qui pourrait vous blâmer ? Lorsque les étapes manuelles du traitement des données vont moins vite que vos ondes cérébrales, beaucoup d'idées très valables se perdent en chemin.

Laissez libre cours à vos capacités de raisonnement !

Vous avez besoin d'un puissant outil de synthèse capable de fournir automatiquement plusieurs vues et résultats. Vous pourrez ainsi explorer les valeurs inhabituelles, déceler des tendances et soulever des questions plus pointues très rapidement.

L'outil Agréger d'Alteryx traite les données instantanément à chaque étape, de sorte que vous avez de nombreuses vues sous les yeux pour arriver plus vite à des conclusions déterminantes. Oubliez les tableaux croisés dynamiques ! Groupez vos données et effectuez autant de calculs que vous voulez sur les champs de votre choix. Vous avez à votre disposition des fonctions plus avancées que dans votre feuille de calcul pour réaliser notamment des analyses financières, numériques, géographiques et comportementales.

En définitive, vous allez fournir des insights complets, nuancés, conformes aux attentes et dans les temps. Y voyez-vous plus clair maintenant ?

NE PARTEZ PAS.

VIDÉO

Écoutez le témoignage d'Aimpoint Digital sur ses débuts avec l'analytique en libre-service dans cette vidéo. Si vous ne connaissez pas Alteryx Designer, vous y découvrirez une brève présentation du produit et les raisons de l'utiliser.

FORMATIONS

Suivez nos formations à la demande conçues pour les personnes qui utilisent des feuilles de calcul.

Wavy colorful lines intersecting
Article de blog
3 min to read

2021 Alteryx Podcast Wrap-up

In this special crossover podcast episode, hosts Maddie Johannsen and Susan Currie Sivek relive some of their favorite standout moments and special guests.

Analyste
Responsable Analytique
Data Scientist
Lisez vite !
People interacting in front of glass windows with building in the background. Black and white image.
Article de blog
5 min to read

How Chief Data Officers can Improve Supply Chain Performance with Analytics Automation

As supply chain disruption continues, company leaders should tap Chief Data Officers who are uniquely positioned to shore up critical decisions.

Chaîne d'approvisionnement
Responsable Business
Responsable Analytique
Lisez vite !
Ships and sunset
Article de blog
5 min to read

What Does the Democratization of Analytics Look Like for Government?

For organizations like the US Navy and others, the ability to better leverage data will be built on the capability to upskill the domain experts in the use of analytics.

Secteur public : DOD (États-Unis)
Secteur public : FED (États-Unis)
Secteur public : service des renseignements
Lisez vite !