製品ガイド

SQLユーザー向け
Alteryxガイド

データアナリストにとって、データへのアクセスと準備に対する従来のアプローチは多大な時間を要するものとなりがちです。この状況に苛立つアナリストの中には、IT や SQL の開発者に頼らずに、自ら問題に対処して SQL のコーディングを学ぶ人もいます。SQL を書く上でアナリストが直面する最大の課題は、まずは SQL を機能させることです。SQL にはオートコレクト機能がないためピリオドやコンマの誤使用が自動的にキャッチされず、スクリプト全体が失敗する可能性があります。

Alteryx はワークフローベースの環境という異なるアプローチを採用しているため、非構造化データを含む複数のソースのデータを準備、ブレンド、分析することが可能になります。コードのテストとデバッグに時間を費やすのではなく、繰り返し可能なワークフローを構築して、他のアナリストやIT部門、ビジネスの意思決定者など、あらゆる部署の社員にデータの抽出と変換の方法を正確に示すことができます。その成果は?コードの作成に要する時間が短縮され、より高い透明性と一貫性の向上が得られます。

Alteryx は、多くのアナリストが SQL でコーディングする最も一般的なデータ関連のプロセスをリストアップしています。それとともに、Alteryx で同じプロセスを実行する方法が示されています。これらの例は、SQL コードを書くアナリストにとって、SQL の知識を Alteryx ワークフローに置き換える方法の理解に役立つものです。

Alteryx が SQL コーダーにどのように役立つかについての詳細は、ホワイトペーパー「セルフサービスデータ分析の有効化: Alteryx が SQL ユーザーを支援する 5 つの方法」をダウンロードしてください。Alteryx の 14 日間無料試用版もぜひお試しください。

選択

SELECT, FROM, WHERE, GROUP BY, HAVING, ORDER BY

SQL
Alteryx

sql 画面

 

 

alteryx 入力ツール   Alteryx のデータにアクセスするには、データ入力ツールをキャンバスにドラッグアンドドロップし、データベースを探して選択します。

この例では、データ入力ツールを使用して SQL Server データベースに接続しています。

 

alteryx データ入力設定

alteryx セレクトツール  セレクトツールを使って、データタイプを変更、フィールドを選択または選択解除、あるいはフィールド名を任意の名前に変更することができます。ここでは、顧客 ID がフィールド名です。 

alteryx 画面選択

sql 画面

alteryx 結合ツール  Alteryx では、結合ツールで複数のデータセットを簡単に結合することができます。 

結合ツールを使用して共通のフィールド(主キー)を持つ 2 つのテーブルを結合すると、Alteryx が自動的に 3 つのレコードセットを返します。

  • 内部結合 (J) : 共通フィールドに基づいてレコードを一致させながら、結合しようとするテーブル (R) の列と結合したソーステーブル (L) の列。
  • 左非結合 (L) : 結合しようとするテーブル (R) に一致するものが見つからない、元のテーブル (L) のレコード
  • 右非結合 (R) : ソーステーブル (L) に一致するものが見つからない、結合しようとするテーブル (R) のレコード


こちらは顧客 ID の結合です。 

alteryx 画面結合


Alteryx の結合ツールをロックする  結合ツールの他に、Alteryx にはインデータベース結合ツールもあります。このツールを使用すると、データベースからデータを移動することなく大規模なデータセットに対してブレンディングと分析を行うことができ、従来の分析方法よりも大幅にパフォーマンスが向上します。 

インデータベース結合ツールによって、内部結合、左外部結合、右外部結合、および完全外部結合を行うことができます。

Alteryx のインデータベースツールの詳細については、こちらをご覧ください。


Alteryx のユニオンツール   ユニオンツールを使用すると、フィールド名あるいは各列の位置に基づいて複数のレコードセットを組み合わせることができます。各レコードセットの列ヘッダーの順序を簡単に変更して一致させることができます。

ここでは、結合されていない左レコードと(内部)結合レコードの2つのレコードセットを結合し、左外部結合を生成します。

alteryx ユニオン画面

alteryx ユニオンツール設定

sql 画面

フィルターツール   特定の基準に基づくレコードの制限は、フィルターツールを使用して実行します。フィルタリングには、単純な比較から複雑な条件文まで何でも使用できます。この例では、米国を含まない国のレコードのみがフィルタリングされています。 

フィルター画面

sql 画面

集計ツール   Alteryx では、集計ツールを使用して複数のレコードにわたるデータを収集し、集計関数を適用して結果を 1 つまたは複数のフィールドでグループ化します。

この例では、集計ツールを使用して国ごと(英国、ドイツなど)にグループ化し、国別の合計金額の平均を出しています。 

集計設定画面

フィルターツール   特定の基準に基づくレコードの制限は、フィルターツールを使用して実行できます。フィルタリングには、単純な比較から複雑な条件文まで何でも使用できます。この例では、平均合計が1000またはそれ以上のレコードのみを示しています。

フィルター画面 2

SQL 全設定

ソートツール   Alteryx のソートツールを使用すると、必要に応じてデータを整理できるようになります。列の名前を選択し、昇順または降順のどちらかを選びます。この例では、平均合計金額を降順で表示しています。

ソート設定 alteryx

alteryxの全ワークフロー

これは、SQL SELECT 文の完全な Alteryx ワークフローです。

クロス 結合

クロス 結合

SQL
Alteryx

sql 画面

フィールド付加ツール   フィールド付加ツールを使って、ソース入力のフィールドをターゲット入力のすべてのレコードに追加できます。ターゲット入力の各レコードは、ソース入力の各レコードごとに複製されます。この例では、すべての流通センターのレコードを各顧客レコードに追加しています。 

フィールド付加画面

alteryxのクロス結合を使用する

この Alteryx ワークフローでは、流通センターのレコードを各顧客レコードに追加しています。

Where Between

Where Between

SQL
Alteryx

sql 画面

フィルターツール   特定の範囲内のフィールド値を持つレコードに限定するには、Alteryx フィルターツールを使用します。この例では、2016 年 12 月 1 日〜31 日の期間における注文日をフィルタリングしています。 

フィルター画面

alteryxでwhere betweenを実行する

この Alteryx ワークフローでは、2016 年 12 月 1 日~31 日の期間に受けた注文に限定して顧客注文データをフィルタリングしています。

Where In

Where In

SQL
Alteryx

sql 画面

フィルターツール   可能な選択肢のセットに属するフィールド値を持つレコードに限定するには、Alteryx フィルターツールを使用します。この例では、米国または英国のいずれかの国の顧客のフィルタリングを行っています。

sql 画面

alteryx wherein

この Alteryx ワークフローでは、米国または英国のいずれかの国の顧客のフィルタリングを行っています。

Distinct

Distinct

SQL
Alteryx

sql 画面

Alteryx のユニオンツール   Alteryx のユニークツールを使うと、選択したフィールドに基づいて、データを 2 つのストリーム(重複したレコードと固有のレコード)に分けることができます。この例で選択されたフィールドは国です。

alteryxで国を選択する

Alteryxでdistinctを実行する

ユニークツールを使ったこの Alteryx ワークフローでは、選択したフィールド(この例では「国」)に基づいて、データを2つのストリーム(重複したレコードと固有のレコード)に分けています。