Solutions

Profilage des données

Des données saines font ressortir de meilleurs insights

Accélérez la création de vos ensembles de données

Savez-vous si vos données sont statistiquement fiables et prêtes pour l'analyse ? Avec des fonctions complètes de profilage intégrées à son processus de préparation et de fusion des données, Alteryx permet aux analystes et aux utilisateurs métier d'évaluer instantanément l'intégrité statistique, l'exhaustivité et la qualité d'un ensemble de données, de l'enrichir ou de le compléter pour qu'il soit prêt pour l'analyse.

EN SAVOIR PLUS

Déterminez rapidement si vos données sont prêtes pour l'analyse

Le temps passé à préparer les données n'est qu'une partie de l'histoire. Cette étape implique en effet plusieurs heures à vérifier qu'elles sont suffisamment complètes pour permettre des conclusions fiables. Grâce à Alteryx, les « data workers » et les analystes peuvent évaluer eux-mêmes l'intégrité d'un ensemble de données pendant qu'ils travaillent dessus.

  • Visualisations pour le profilage des données : les histogrammes, les diagrammes de dispersion et les colorations au niveau des champs fournissent une vue de la distribution statistique des valeurs et de la segmentation en fonction de la qualité et des problèmes.
  • Évaluation graphique de l'intégrité des données : observez la distribution statistique de l'ensemble de données et le degré de complétude des données dans chaque colonne.
  • Identification des problèmes de données granulaires : examinez les représentations graphiques du profilage montrant la qualité des données de chaque colonne en fonction de différents types de données.

 

Exploitez la puissance du profilage détaillé des données

Avec Alteryx, le profilage des données fournit des statistiques spécifiques basées sur des champs individuels de vos données, d'après leurs types, d'où qu'elles proviennent. Déterminez la propreté et la qualité de vos valeurs de chaînes, comme le nombre de valeurs null ou de chaînes non standard, ou évaluez la validité de vos valeurs numériques.

  • Évaluation de l'intégrité des chaînes : indiquez la distribution des valeurs de chaînes avec les problèmes tels que les espaces de début et de fin, les valeurs uniques, les valeurs null ainsi que les longueurs moyennes, maximales et minimales.
  • Évaluation de l'intégrité des valeurs numériques : observez le maximum, la moyenne, le minimum, l'écart type et les regroupements de percentiles des valeurs numériques.
  • Profilage de toutes les données : profilez vos données à partir d'entrepôts de données, d'applications cloud, de feuilles de calcul ou d'autres sources ; tout est réuni dans Alteryx Designer.

 

Utilisez des outils d'enrichissement des données et d'amélioration de leur qualité

Alors que vous savez que vous devez améliorer la qualité de vos données, rien ne vous oblige à revenir à la case départ. Alteryx fournit les fonctions nécessaires pour les manipuler, les associer et y incorporer les données tierces dont vous avez besoin pour améliorer leur intégrité.

  • Amélioration de la qualité : plus de 45 outils, tels que la recherche et le remplacement, l'ajout, l'imputation de valeurs, l'analyse syntaxique, la mise en correspondance, etc. vous permettent de nettoyer et d'épurer vos données.
  • Correspondances partielles : isolez et gérez facilement les doublons non identiques en fonction de paramètres ajustables.
  • Enrichissement des données : ajoutez des ensembles de données complémentaires ou tiers, tels que des données d'Experian, de TomTom ou du Bureau du recensement des États-Unis, pour ajouter des champs et des valeurs géographiques ou démographiques.