AutoMLとは

自動機械学習(AutoML)では、自動化されたプロセスを通じてML(機械学習)モデルの構築、検証、反復、探索を行えるため、専門的なスキル不要で誰もがMLを活用できます。AutoMLを利用すれば、データの準備とクリーニング、特徴量の作成と選択、最適なモデル群の選択、ハイパーパラメーターの最適化、結果の分析などを簡単に自動化できます。また、データの可視化、インサイトの生成、モデルの説明可能性、モデルの導入にも役立ちます。

データアナリティクスにおいて自動機械学習が重要な理由

MLモデルは企業にとって貴重なインサイトをもたらしますが、モデルを構築する担当者が必ずしもMLの専門知識を十分に持っているとは限りません。AutoMLはデータサイエンティストの役割を置き換えるものではなく、業務を支援し、生産性を大幅に向上させます。AutoMLを活用すれば、データサイエンティストだけでなく、誰もがコードが必要な作業を自動化し、モデルのテストやインサイトの分析に集中できる環境が整います。シチズンデータサイエンティストのような比較的経験が浅いユーザーでも、自動機械学習を活用すれば、データからインサイトを直感的に引き出し、データサイエンスへの理解を短期間で深められます。

AutoMLの仕組み

自動機械学習には通常、以下のステップが含まれます。

データの評価と前処理 - 自動機械学習
データ評価と前処理:有用なモデル学習用データセットを作成するために、データを準備し、クレンジングし、変換します。
特徴量エンジニアリング - 自動機械学習
特徴量エンジニアリング:既存のモデル学習データに新しいデータ列を作成し、データが示す現象の予測因子をより適切に表現するか、またはMLアルゴリズムでより効果的に機能するかを確認するプロセスです。
特徴量選択 - 自動機械学習
特徴量の選択:新しい特徴量が作成された際に、AutoMLによってモデルの生成に有用な特徴量のみを選択することができます。
アルゴリズムの選択 - 自動機械学習
アルゴリズムの選択:競合する候補モデルをレビューし、目的とする指標(例:正解率、再現率、均衡のとれた正解率)に基づいて、最も高いパフォーマンスを発揮するモデルを選択します。
ハイパーパラメータのチューニング - 自動機械学習
ハイパーパラメーターのチューニング:学習アルゴリズムに最適なハイパーパラメーターが選択されます。

自動機械学習の活用例

自動機械学習は、次のような多様なビジネス課題の解決に役立ちます。

パーソナライゼーション

お客様への一方的な語りかけは、もはや意味をなしません。ビジネスの成功には、一人ひとりのニーズに寄り添うことが不可欠です。AutoMLは顧客の嗜好や行動を学習し、より効果的かつスケーラブルなパーソナライゼーションを実現します。これにより、パーソナライズされたコンテンツやレコメンデーションを提供し、お客様の関心を引き出し、売上向上につなげます。

顧客記録のクリーニング

スペルミス、更新時のエラー、一貫性のない情報などにより、企業の顧客データベースに重複が生じることがありますが、AutoMLを用いることで、こうした異常値を簡単に特定・修正し、データの精度を向上させ、その価値を高めることができます。

顧客離反の抑制

新たなお客様の獲得は、どのようなビジネスにおいても重要ですが、既存のお客様の維持も同様に欠かせません。AutoMLは顧客活動のパターンを分析し、どのお客様が競合他社に乗り換える可能性が高いかを予測できます。これにより、離反の可能性が高いお客様に絞ってキャンペーンを実施し、利益とブランド価値を向上させることができます。

不正の検知

米国政府が被る経済的損失は、年間約800億ドルに上ると言われています。あらゆる連邦政府機関が不正の脅威にさらされていますが、不正の疑いが高い請求書などを入念に調査するためのリソースは常に不足しています。しかし、年々巧妙化する不正行為に対処するため、ソリューションも加速度的に進化しています。AutoMLを既存の業務システムに組み込めば、過去の不正行為に関するデータを活用し、危険な兆候を察知して問題に迅速に対処できます。

AutoMLを活用しませんか?

Alteryxでは、ガイド付きのチュートリアルモードを用いて、専門的な知識がなくてもデータサイエンティストが使うような高度なAutoMLの手法を学びながら活用できます。Alteryx Machine Learningでは、データの準備、ブレンディング、エンリッチメント(強化)など、データ分析の各ステップにAutoMLが組み込まれています。

以下のようなことを実現できます。

  • データサイエンス・MLプロセスのステップを自動化
  • そのデータについて多数の予測モデルをトレーニング
  • トレーニングしたモデルのパフォーマンス(受信者操作特性、適合率、再現率、正解率、均衡のとれた正解率など)

さらには以下のようなことも実現できます。

  • インタラクティブな可視化
  • ビジネスのステークホルダーが容易に理解できるレポートの作成
  • 業務システムにモデルを導入
  • トレーニングや用語集の統合
  • トレーニングデータの評価プロセスを自動化
  • トレーニングデータの改善や自動調整