MLOps は、データサイエンスの運用における、部門横断的、協調的、反復的なプロセスであり、機械学習 (Machine Learning、ML) やその他のタイプのモデルを、反復可能なプロセスを介してデプロイし、継続的に監視できる再利用可能なソフトウェア成果物として管理します。

機械学習オペレーション (MLOps) とは

機械学習 (Machine Learning、ML)
モデルは、ビジネスに価値あるインサイトをもたらします。しかしながら、機械学習モデルが効果を発揮するためには、継続的に組織のデータにアクセスして分析を行う必要があります。これを可能にする重要なプロセスが、機械学習オペレーション
(MLOps、Machine Learning Operations) です。

MLOps
は、データサイエンスの運用における部門横断的、協調的、反復的なプロセスです。MLOps
は、機械学習やその他のタイプのモデルを再利用可能なソフトウェア成果物して管理し、それらを反復可能なプロセスでデプロイし、継続的に監視することを可能します

MLOps
は、継続的な統合とモデルの反復的かつ迅速なデプロイメントをサポートします。これにより、企業はデータから貴重な情報やインサイトをより迅速に引き出すことができるようになります。また、MLOps
は、運用中のモデルを継続的に監視し、再トレーニングを行うことで、データの経時的変化(ドリフト)に応じてモデルが最適に動作できるようにします。

MLOps のメリット

MLOps の主な利点の 1
つは、データサイエンス、機械学習、統計などのモデルタイプを利用して、ビジネスの成果を迅速に得られることです。MLOps
は、モデルを繰り返しデプロイし、継続的に監視することで、こうした成果を実現させます。MLOps
プロセスでは以下のことが可能になります。

  • 自動化されたプロセスで、より多くのモデルを迅速にデプロイ
  • モデルの迅速な提供により、価値実現までの時間を短縮
  • 共同作業とモデルの再利用により生産性を最適化
  • 本番運用されないモデルに時間とコストを費やすリスクを低減
  • モデルを継続的に監視し、経時的な変化に応じてデータを更新

MLOps プロセス

MLOps Lifecycle Process

MLOps は、大規模で迅速なモデルの提供をサポートします。MLOps
プロセスは、おおまかに次のステップに分けられます。

 

MLOps- Build
構築 – データ準備、特徴量エンジニアリング、モデル構築、検証を行います。
MLOps- Manage
管理 – 作成されたモデルの多くは監査とバージョン管理が可能なモデルリポジトリに保存されます。これにより、作成済みのモデルを組織全体で再利用できるようになります。

 

MLOps- Deploy
デプロイ – モデルやパイプラインのエクスポート、デプロイ、本番のビジネスシステムやアプリケーションとの統合を行います。
MLOps- Monitor
監視 – 継続的な監視により、最適なパフォーマンスを確保します。データのドリフトに応じて、モデルを再トレーニングしたり、既存のモデルを新しいモデルに置き換えたりします。

MLOps の課題

多くの組織が、機械学習モデルを本番環境に移行する際に課題に直面しています。

デプロイする目的で作成されたモデルの 60% – 80%
がデプロイされることなく終わっています。また、モデルのデプロイには通常 6 – 8
か月を要し、長い時間を経てデプロイできるようになったとしても、その頃には陳腐化してしまっている可能性があります。

多くの組織が、機械学習アプリケーションと既存の本番アプリケーションの統合に苦労したあげく、結果として本番に投入されることのないデータサイエンスプロジェクトに時間とコストを奪われています。

MLOps
は、このような失敗のリスクを大幅に軽減し、モデルをより迅速に本番環境に投入することで、ビジネスにもたらす価値を最大化します。

MLOps、DevOps、DataOps の比較

MLOps
は、データの収集、前処理、モデルのトレーニング、評価、デプロイ、再トレーニングを、複数のチーム間で共有・維持できる単一のプロセスを実現します。MLOps
では、DevOps、ITOps、データエンジニア、データサイエンスなどのチームや、その他のさまざまな部門が協力してコミュニケーションをとることができ、ソフトウェアにおける
DevOps (開発オペレーション)
と同様に、本番環境での機械学習モデルの開発・維持方法について共通の理解を得ることができます。

DevOps
では、ソフトウェアの継続的な配信と、コードの統合、テスト、デプロイの自動化に重点が置かれており、データや分析の管理はカバーされませんMLOps
のプロセスは DevOps を手本としており、モデルのデプロイメントサービスについては
DevOps チームとのコラボレーションが必要となります。

DataOps (データオペレーション)
は、データパイプラインの管理とプロセスの自動により、データ分析にかかる時間を短縮することを目的としています。

MLOps とアナリティックプロセスオートメーション

アナリティックプロセスオートメーション (APA)
は、データ準備・ブレンディング、機械学習モデルの作成、MLOps
の主要なプロセスを統合し、インプットからインサイトの獲得、成果の実現に至るまでを加速化させる、大規模で包括的なソリューションです。

アナリティックプロセスオートメーションは、データサイエンス・分析ワークフローのすべての構成要素をつなぎ、スマートで迅速な意思決定を可能にします。APA
ソリューションを使用すると、自動化された反復可能なワークフローを簡単に構築して、データサイエンティストの時間を節約し、データ準備、モデル作成、MLOps
のプロセスを最適化することができます。

MLOps を始めるには

The
Alteryx Analytic Process Automation Platform™
は、データサイエンスプロセスを加速させ、 MLOps にさらなる成功をもたらします。

データのアクセス、準備、モデル作成、モニタリング、モデル調整や、分析結果の共有などのすべてを、1
つのプラットフォーム上で簡単に実行できます。プラットフォームの
無料トライアル
にサインアップして、その実力をぜひご体感ください

Alteryx のデータサイエンス、機械学習、MLOps
ソリューションの詳細については、お気軽にお問い合わせください。