ユニバーサルブログ

行や列にとらわれない 6 つの方法

データデコンストラクションとプロセス再構築

弱点を強みに変えましょう。ワークシートからワークフローへ移行することで、業務のクオリティを高めるだけでなく、キャリアパスの向上や、データのトレンドへのより良いキャッチアップが可能になります。進歩に翻弄されるか、デジタルトランスフォーメーションに活路を見出すかは、あなた次第です。

今回は最新の分析で簡素化できる、スプレッドシートのデータ関連タスクのいくつかに焦点を当て、行や列にとらわれずにスプレッドシートへの依存から脱却する 6 つの方法をご紹介します。

#1 入力 

バラバラなデータソースにうんざりしていませんか?

データアナリストの人生はスイートなはずですよね。データの山の奥深くに眠っている価値あるインサイトを掘り起こすだけで、お金が手に入るのです。さて、張り切ってデータセットを開くことから始めましょう。これらのデータセットには、さまざまな部門からの多種多様なソースやプログラムから抽出されたデータが含まれています。

そして混乱が始まります。スプレッドシートにバラバラの形式のデータを取り込むことは、困難そのもの。データで分析を行うためには、数々の面倒な前処理を施さなければならないのです。結局のところ、現実はそれほど甘くないのかもしれません。

データの入力作業を続けるうちに、さまざまな心配が頭をよぎるようになってきました。重複して情報を入力しているのでは?異なる形式のファイルを結合すると何かが失われるかも?データセットとの互換性に問題があり、重要な情報が抜け落ちてしまうかも?

アナリストは常に、有用さに欠ける形式や、各部門特有のデータサイロに向き合わなければなりません。そして、あらゆるデータがロジカルに一貫性を持ち、スムーズかつシームレスに整合された、データの正規化を夢に見ています。
米国のトップヘルスケアプロバイダである Thomas Hall 社は、社内の複数のチームと緊密に連携し、トレンドとパフォーマンスの分析と、レポートティングを自動化しています。同社がいかにしてワークシートからワークフローへの移行を成し遂げたかをご覧ください

どんなデータセットもお任せあれ。

互換性のないファイル形式、データベース接続、クラウドデータストアで作業する場合でも、データセットを容易に構築して正規化できる方法があります。さらには、取り入れられるデータ型はほぼ無限大です。必要となるのは、あらゆるフォーマットを受け入れ、取りこぼしなくデータを拾うことのできるスターティングポイントです。

Alteryx では、そうした出発点をキャンバスと呼んでいます。シンプルかつ視覚的なキャンバスは、これまでの作業を一新させます。必要な手順は、入力データツールをキャンバスにドラッグアンドドロップし、インポートしたいデータセットを検索して選択するだけです。

クイックデモをご覧ください

キャンバス上でデータを扱う方法をご覧になり、退屈なデータ準備に別れを告げ、革新的なインサイトの獲得に力を注ぎましょう。


これまで、スプレッドシートでデータソースを取り入れるべく、途方もない時間を無駄にしてきたのであれば、Alteryx は手放せない存在となるでしょう。バラバラのファイル形式やファイル構造であっても、Alteryx を使えば難なく解決できます。Excel、Access、XML、SAS、SPSS、MapInfo、その他の各種データベースや HDFS に格納されたデータに、ローカルでアクセスすることもできます。 

さらに、Alteryx では、Amazon S3、Twitter、Foursquare、Marketo、Salesforce、Microsoft SharePoint などのクラウドシステムや、Amazon Redshift、Impala、Spark などの他のビッグデータ環境にもダイレクトに接続することができます。 

#2 クレンジング

データクリーニング:喜びはいずこへ。

実のところ、アナリストはデータクリーニングという退屈な仕事に大半の時間を費やさなければなりません。お目当てのパート(分析)にたどり着くころには、疲れ切って、分析のために十分な時間を設けられないこともしばしばです。それでも分析は行わなければなりません。こうしたバランスの悪さは、データクリーニングが原因で生じているのでしょうか?それともスプレッドシートを使っているからなのでしょうか。

スプレッドシートでの手作業のデータクリーニングには多くの手間がかかります。解析、列の作成、行の削除、空白の削除などに、気が遠くなるほどの時間を費やさなければなりません。

しかしながら、最も恐ろしい点は、カットアンドペースト、名前の変更等は、時間がかかるだけでなく、ミスが起こりやすいという点です。初期の段階での計算間違い、勘違い、レコードの重複などにより、分析があらぬ方向へと進んでしまい、結果としてやり直しを余儀なくされることもあります。

クリーニング時には、データの完全性に細心の注意を払う必要があります。データを移動させたり、形式を変更したり、データを整理したりする際には、データの精度と一貫性を保ち、データの内容が予期せぬ方向に変わってしまわないように気を付けなければなりません。
ワークブックでワークフローのスキルを鍛えるために、チャレンジ #19:Excel レコードロケーターに挑戦してみましょう。

今こそ手作業のアプローチを見直しましょう。

気の滅入るクリックの連続ではなく、データクレンジングを高度な分析ツールで実行できる数多くの機能の一つとして利用できるとしたらどうでしょうか。わずか数回のクリックでデータクレンジングを簡単に実行できるとしたらどうでしょうか。

Alteryx を使えば、データクリーニングに費やす時間を劇的に減らすことができます。

Alteryx では、新たな列の作成、行や列の削除、データ型の変更などをワンステップで行えます。また、どんなデータも自動で解釈し、データの内容に適した型とサイズを割り当てることができます。手作業で複数のファイルに変更を加える必要はもうありません。変更履歴をいつでも追跡できるため、ミスをしても最初からやり直す必要もありません。

こうした高度なデータクリーニングのアプローチにより、手作業のプロセスや人為的ミスを排除し、より重要な仕事のために時間を確保できるようになります。

#3 統合

完璧なデータ結合を実現しましょう。

ワークシートのデータをブレンドしたり追加したりする際には、細心の注意と高いスキルが求められます。また、それらをいかにうまく行うかが、今後を大きく左右します。データセットを結合するたびに、ソース素材そのものが一新されます。運が良ければ、うっかりデータセットを破損させることなく切り抜けられますが、さもなければ全部やり直す羽目になったりもします。

他のスプレッドシートの処理ステップと同様に、データセットの結合は多大な労力を要します。「VLOOKUP」の繰り返しは、もはや狂気の沙汰ではないでしょうか。

従来の手法でデータをブレンドする際に障壁となるのが、スプレッドシートは非依存型のプログラムではないという点です。表計算プログラムでは特定のフォーマットのみが認識されるため、他のデータとブレンドする際には、VLOOKUP や INDEX MATCH などのマニュアルツールで直接入力を行わなければなりません。複数のフィールドやシートで作業すると、エラーが生じる確率も格段に高くなります。
世界中で毎日 19 億杯以上ものコカ・コーラ社のドリンクが愛飲されています。コカ・コーラ社は、Alteryx を使用して、対応する大量のデータの価値を引き出しています。詳細をご確認ください

ブレンドをもっと簡単に。

もしお使いのプログラムで、フォーマットの制約に縛られず、時間を無駄にすることもなく、もっとシンプルにデータをブレンドできたらどうでしょうか。また、そのプログラムではあらゆる作業工程が記録されているため、いつでも前に戻ってやり直すことができるとしたらどうでしょうか。

Alteryx のシンプルなツールセット(ユニオン、検索置換、結合)は、従来のスプレッドシートによる面倒なブレンドの工程を簡素化するだけでなく、これまでにない画期的な新機能の数々を提供します。必要に応じて、ワークフローの任意の地点まで工程をトレースしたり、遡ったりもできます。

また、各列の位置を維持しながら、フィールド名に基づいて複数のシートを組み合わせたり、必要に応じて列の並びを変更したりすることもできます。内部結合、または外部結合を実行すると、共通のフィールドに基づいて 2 つのデータストリームが結合されます。

このように Alteryx で、データ結合を自在に行い、作業時間を大幅に節約することで、データセットをより深く分析することが可能になります。

#4 変換

うっかりフィルターをかけ忘れて一大事に? お気持ちお察しします。

データのより深い意味を発見するためには、自身で選び抜いたパラメーターを通して、データを掘り下げていく必要があります。スプレッドシートでこれを実現するためには、フィルタリング、ソート、ピボットなどで、データを転置したり、並べ替えたりする必要があります。こうした作業の難易度は高くはないものの、手動で行わなければならないため、手間がかかります。

クリップボードを使用することで、データ変換プロセスの前のポイントに戻ることはできます。とはいうものの、このようなエラーが起こりやすい手動プロセスに頼り続けても問題ないのでしょうか。

スプレッドシートでのデータ変換プロセスは、ストレスフルな上に時間がかかります。さらに、データフィールドやフィルターの見落としにより、企業に多大な損失が生じる恐れもあります。分析の終了時に、何も取りこぼしていないと、職業生命をかけて断言できますか?

21 世紀に合った働き方を。

高度な分析ツールでスマートにデータの変換作業を行えば、業務の最もエキサイティングなパートである分析を実行する際に、エラーやリスクを大幅に削減できます。

Alteryx のソート、転置、クロスタブツールを使えば、データの向きを自動的に変えたり、ピボットしたりすることができ、全体像をすばやく把握できます。また、こうしたツールをワークフロー上で使用することで、いつでも開始地点に戻り、これまでの工程を説明することもできます。これは、自分の方法論を説明し、その場で関係者を納得させるうえでも、大いに役立ちます。

スプレッドシートによるデータ変換とワークフローのデータ変換は、どう違うのでしょうか。おそらく説明するまでもないでしょう。それは、1950 年代のダイヤル式電話と、1,000 通りものことが実現できる最新のスマートフォンを比較するようなものです。データ主導の先進的な戦略を確立する上で、分析の文化を構築する組織はワークフローを活用し、データのサイロ化に悩む組織に大きく差をつけています。
データ主導の成功により、進化を続ける大手ファストフードチェーンの事例を紹介します。新たな分析の旅へと乗り出した同社のサクセスストーリーをご覧ください。

#5 計算

式にイライラ?分かります。

ちょっと計算してみましょう。スプレッドシートで if 文を使い、計算式を設定すること自体は難しいことではありません。ただし、そうした式をありとあらゆる所に適用する必要があるとしたらどうでしょうか。

式を適用する際には、今何をしていて、どこまで進めたか等、多くの情報を頭にとどめなければなりません。そして、どれが不要な列のセットか分からなくなってしまったり、非表示のセルを見落としてしまったり、クリップボードのデータが消えてしまったりといったことが起こりうるのです。

まさに一大事です。

設定して、あとは任せましょう。

1 つのツールで一度式を設定するだけで、あらゆる場所に正確に適用できるとしたらどうでしょうか。手作業であちこちに式をちりばめ、作業した内容を必死で記憶にとどめておくといった必要がなくなります。

Alteryx のフォーミュラツールは、ワンアクションで入力テーブルにフィールドを追加したり、式やデータ関係に基づいてデータフィールドを作成および更新できたりする強力なプロセッサです。ワークフローで追加、削除、変更箇所を都度確認できるため、いつ、どこで、何が起きたかを正確に把握しながら、いつでも前に戻ってやり直したり、再考したりすることができます。

Alteryx では、データ、ロジック、実行は別々のレイヤーに存在します。これにより、ロジックの実行前に時間をかけてプランニングでき、実行後にデータを失う心配もなくなります。また、変更やレコードの追加があった場合にロジックが自動的に適用されるため、結果に自信を持つことができます

セルフサービス分析のマジック

  • 手動のクロスタブ操作?ありえません。

  • 手動の式設定?必要ありません。

  • 手動の集計?もちろん不要です。

価値ある分析を今すぐ実現させましょう。

あらゆる心配事を解消して、信じられないほどの自由を手に入れましょう。

#6 – 集計

入力速度に自信はありますか?

データの記述的および予測的分析の要となるのがデータ集計であり、そこには無限の価値が潜んでいます。ただし、スプレッドシートのピボットテーブルのデータ集計は、単焦点モードで結果を追い求めるようなものです。このようにデータを捉えるばかりでは、正確でアジャイルなデータ分析の実現には程遠く、上司からの手ごわい質問にすばやく答えることもできません。

また、大規模なデータセットを扱いづらいといった技術的な制約もあり、パラメーターやポジションを変更したり、仮定を再考したりする際に、システムがオーバーロードしてしまうこともしばしばです。

手動のデータ集計は、手入力の速度、スプレッドシートの機能、PC のスペックなどに大きく左右されます。また、結果全体ではなく、結果の一部分のみを切り取ることしかできません。

このような制限に、せっかくの分析が邪魔されてしまうのは苛立たしいものです。また、手動でのデータ処理に時間を取られると、結果として多くの貴重なアイデアを失うことにもなりかねません。

とびきりの余裕を手に入れましょう。

複数の結果やビューを自動表示できるパワフルな集計ツールがあれば、簡単に外れ値やパターンを発見したり、さらに踏み込んだ質問にすばやく答えられるようになります。

Alteryx の集計ツールでは、データジャーニーの各ステップでデータを瞬時に処理し、一度に複数のビューを表示できるため、成果を得るまでの時間を短縮できます。もうピボットテーブルに時間を費やす必要はありません。データをグループ化して、財務分析、数値分析、空間分析、行動分析などの、スプレッドシートにはない高度な機能を含むお好みのフィールドで自在に集計を行えます。

これにより、信頼性が高く、ビジネスゴールに即した細やかなインサイトを短時間で手に入れることができるようになります。データの全体像の把握はもはや難しいことではありません。

こちらもぜひどうぞ

動画

セルフサービス分析を開始するための手順をわかりやすく説明した、Aimpoint Digital 社による解説動画をぜひご覧ください。Alteryx Designer の仕組みをざっと理解したい方や、Alteryx を導入するメリットを知りたい方にとって、最適な内容となっています。

トレーニング

スプレッドシートユーザー向けの Alteryx のオンデマンドトレーニングをお試しください。

Wavy colorful lines intersecting
ブログ記事
3 min to read

2021 Alteryx Podcast Wrap-up

In this special crossover podcast episode, hosts Maddie Johannsen and Susan Currie Sivek relive some of their favorite standout moments and special guests.

アナリスト
アナリティクスリーダー
データサイエンティスト
今すぐ読む
People interacting in front of glass windows with building in the background. Black and white image.
ブログ記事
5 min to read

How Chief Data Officers can Improve Supply Chain Performance with Analytics Automation

As supply chain disruption continues, company leaders should tap Chief Data Officers who are uniquely positioned to shore up critical decisions.

サプライチェーン
ビジネスリーダー
アナリティクスリーダー
今すぐ読む
Ships and sunset
ブログ記事
5 min to read

What Does the Democratization of Analytics Look Like for Government?

For organizations like the US Navy and others, the ability to better leverage data will be built on the capability to upskill the domain experts in the use of analytics.

公共部門:DOD
公共部門:FED
公共部門:Intelligence
今すぐ読む