ソリューション

データプロファイリング

確かなインサイトは健全なデータから始まります

分析用データセットをあっという間に構築

データが統計的に有効で分析に使用可能かどうか把握していますか?アナリストとビジネスユーザーは、完全なデータプロファイリング機能がデータ準備およびブレンディング処理に組み込まれた Alteryx を使うと、データセットの統計的健全性、完全性、品質の評価を瞬時に行い、補足データを強化またはブレンドして、分析に使用する準備を整えることができます。

さらに表示

データが分析に使用可能かどうかすばやく評価

データ準備に費やした時間がすべてというわけではありません。有効な結果を得るために、データが統計的に完全であることを保証するのに費やした時間が重要となります。 Alteryx は、データ担当者とアナリストがデータセットに取り組みながら、その健全性を自ら評価できるようにします。

  • データプロファイリングの可視化:フィールドレベルの棒グラフ、散布図、色付けによって、値の統計的分布および品質や問題に基づいたセグメント化を表示
  • データの健全性を可視化して評価:各列で、データセットの統計的分布とデータの完全性の評価を確認
  • 詳細なデータの問題を確認:異なるデータ型に基づき、各列のデータの品質を示すプロファイリンググラフを参照

 

詳細なデータプロファイリング機能を適用

Alteryx のデータプロファイリングは、データをどこから取り込んでも、データ型に基づいてデータの個々のフィールドに即した特定の統計を提供します。Null 値の数や非標準文字列などの文字列値のクレンリネスと質を理解し、数値の有効性の評価を行いましょう。

  • 文字列の健全性評価:先頭または末尾のスペース、固有値、null値、平均、最長と最短の長さなど、問題のある文字列値の分布を表示
  • 数値の健全性評価: 平均、最大値、最小値、標準偏差、分散、パーセンタイルによる数値のグループ分けを参照
  • あらゆるデータをプロファイリング:データウェアハウス、クラウドアプリケーション、スプレッドシート、その他のソースからのデータをすべて Alteryx Designer でプロファイリング

 

データ強化とデータ品質のツールを活用

データ品質を改善するためにすべきことがあると気づいたとしても、最初からやり直しというわけではありません。Alteryx は、データの健全性を向上させるために必要なデータ操作、マッチング、サードパーティデータの組み込みを提供します。

  • 品質の向上:検索と置換、追加、帰属価値、解析、照合その他 45 以上のツールで、データのスクラブとクレンジングを実行
  • ファジーマッチ:調整可能なパラメーターに基づき、同一でない重複を簡単に隔離し、管理
  • データのアップグレード:補足データセットまたはサードパーティのデータセット(Experian、TomTom、米国国勢調査等)を組み込み、空間または人口統計のフィールドと値を増やす