教師あり学習と教師なし学習の違いとは

教師あり学習と教師なし学習は、異なるアプローチにより、企業と消費者をより密接に
結びつけます。ここでは、その違いと仕組みについて説明します。

スマートテクノロジーは、日常生活のほぼすべての場面に浸透し、あらゆるところに
存在しています。より多くの情報や自動化を、クリックのみで利用できることが期待されており、
こうした状況に対応するために、企業は常に最新のテクノロジーを導入し、
活用していく必要があります。

ビジネスにおける人工知能(AI)の進歩は、こうしたニーズをさらに高めています。
指紋や顔のスキャンを生体認証データに変換して、ドアやスマートフォンの
ロックを解除するセキュリティシステムや、異常な購買パターンを検出し、
自動でアラートを送信することで、その取引を人間が確認することのできる
銀行システム、自然言語処理を使って音声を処理し、さまざまな問い合わせに応答する
スマートフォンの音声アシスタントなど、優れたテクノロジーが
生まれており、これらは機械学習(ML)アルゴリズムを介して常に
進化し続けています。

機械学習は人工知能の一種であり、データから学習し、
改善する機能をシステムに提供する役割を
果たします。人間が日々の経験から学ぶのと同じように、機械学習は同じことの繰り返しによって、
徐々に予測や精度を向上させていきます。機械学習
モデル(ML モデル)の学習データはIoTデバイス、各種取引、
ソーシャルメディアなどから収集されます。データサイエンスのアルゴリズムは、
さまざまなパラメータに基づいて情報をふるいにかけ、分類し、
グループ化します。こうしたデータを組み合わせることで、人間の特定の行動パターンを
正確に予測し、それに応じて応答するモデルを作成することが
可能になります。

たとえば、お客様が携帯電話の買い替えを検討しており、インターネットで
候補を絞り込んでいる際に、他の携帯電話や関連するアクセサリーを
おすすめしたりすることができます。
こうした応答モデルは、過去の類似商品の購買データに基づいて作成されており、
これによって他の消費者が同様の情報を得た上で、商品を選択できるモデルを
作成することができます。

MLのアルゴリズムには「教師あり型」、「教師なし型」、「強化型」の3タイプが
あります。強化学習では、機械に一連の決定を行うよう
学習させます。教師あり学習と教師なし学習の一番の
大きな違いは、教師あり学習では「ラベル付きデータセット」を使用し、
教師なし学習では「ラベルなしデータセット」を使用することです。「ラベル」は、データにすでに正しい答えが
タグ付けされていることを意味します。

教師あり学習

MLの教師あり学習では、ラベル付きデータセットを用いて、データを分類したり、
結果正確に予測したりするためのアルゴリズムを学習させます。このモデルでは、
ラベル付きデータを使用してさまざまな特徴量の関連性を測定し、
既知の結果に対するモデルの適合性を改善させていきます。教師あり学習は、主に2つの
タイプに分けられます。

  • 分類:「分類」では、アルゴリズムを用いてデータを特定のセグメントに分類します。身近な例として、メール受信トレイの迷惑メールを拒否するアルゴリズムや、ソーシャルメディア上のユーザーをブロック・制限するアルゴリズムなどがあります。一般的な分類のアルゴリズムには、ロジスティック回帰、K近傍法、ランダムフォレスト、単純ベイズ、確率的勾配降下法、決定木などがあります。
  • 回帰:アルゴリズムを用いて、1つの従属変数と1つまたは複数の独立変数の関係を測定する統計ML手法です。回帰モデルでは、多様なデータの因果関係を予測することができます。たとえば、ビジネスでは、広告収入の成長軌道の
    予測などに利用できます。一般的な回帰アルゴリズムには、リッジ回帰、ラッソ、ニューラルネットワーク回帰、ロジスティック回帰などがあります。

教師なし学習

教師なし学習では、MLアルゴリズムを使ってラベルなしのデータセットを
調査・グループ化します。このようなアルゴリズムは、人間の介入や監視なしで、
データの未知のパターンを明らかにすることができます。アルゴリズムには、主に3つのカテゴリがあります。

  • クラスタリング:クラスタリング手法を用いることで、類似点や相違点に基づき、ラベル付けされていないデータをグループ化できます。例えば、市場のセグメント化を行う場合に、K平均法のアルゴリズムを用いると、類似したデータポイントを一連のパラメータを表すグループに割り当てることができます。こうしたグループ化は、場所、所得のレベル、購入者の年齢などの変数に基づいて行うことができます。
  • 関連付け:データセット内の変数の関係性を特定したい場合には、教師なし学習の関連付けの手法が役に立ちます。例えば「この商品を見た人はこんな商品も見ています」という表示などの、レコメンド機能に最適な手法です。例えば、15人のお客様が携帯電話の購入時に、
    ヘッドホンも併せて購入した場合、このアルゴリズムを通じて、ショッピングカートに携帯電話を入れたお客様全員にヘッドフォンがおすすめされるようになります。
  • 次元削減:データセットには、異常に高い特徴量が含まれる場合があります。こうしたケースにおいて、次元削減は、データの整合性を損なうことなく、異常な特徴量の数を減らすのに役立ちます。次元削減は、データの処理前によく用いられる手法であり、例えば、画像からノイズを除去し、鮮明度を高めるといったケースに利用されています。

教師あり学習と教師なし学習の違い

教師あり学習・教師なし学習の原則を理解すると、両者の違いを簡単に
理解できるようになります。

これらの2つのアプローチの最大の違いは「ラベル付きデータセット」であるか、
「ラベルなしデータセット」であるかという点です。教師あり学習では、分類アルゴリズムや予測アルゴリズムの
学習において、ラベル付きデータセットが用いられます。ラベル付けされた
「学習」用のデータが入力されると、そのデータのさまざまな特徴量の優先順位が、
モデルが望ましい結果にうまく適合するまで繰り返し
調整されます。教師あり学習モデルでは、他のアプローチに比べ、
はるかに高い精度が期待できますが、情報のラベルが適切であることを確認するために、
人間がデータの処理工程に関与する必要があります。

たとえば、教師あり学習モデルでは、空港での混雑時間、空路の渋滞、
気象条件などのパラメータに基づいてフライト時間を予測することができますが、
その際には人間が手作業で
データセットにラベルを付けをおこない、これらの要因がフライトのタイミングに
どのように影響するかをモデルに学習させる必要があります。教師ありモデルでは結果を知っているからこそ、
雪がフライトの遅れの要因であると結論づけることができるのです。

これに対し、教師なし学習モデルは、人間の干渉を受けずに機能し、
ラベルなしデータから、ある種の構造を見つけ出します。
ここで必要となる唯一の人間の介入は、出力変数の検証です。
例えば、誰かが新しいノートパソコンをオンラインで購入すると、
教師なし学習モデルは、その購入者がそのノートパソコンに関連する製品のセットを
まとめて購入する購入者のグループに属していることを把握します。しかし、レコメンデーションエンジンによる
ノートパソコン用バッグ、スクリーンガード、カーチャージャーなどの
オプションの提供を検証するのは、データアナリストの役目となります。

結果とインサイト

教師あり学習と教師なし学習の目標は異なります。前者は
新たに導入されたデータの結果を予測することを目的とし、後者は大量の新規データから
新たな知見を得ることを目的としています。教師あり学習では、
どのような結果が得られるかがあらかじめ分かっているのに対し、教師なし学習では、
新しい未知なるものを発見していくことになります。

多様なアプリケーション

教師あり学習で作成したモデルは、スパム検の出や感情分析の処理、
天気予報や
価格変動の予測などに適しています。一方で、教師なし学習は、
あらゆるタイプの異常や外れ値を探すのに最適です。
また、教師あり学習は、レコメンデーションエンジンや、顧客プロファイルの理解にも
適しています。

多様な複雑さ

教師あり学習でMLモデルを作成する場合、必要なツールは非常にシンプルで、
多くの場合においてRやPythonのようなプログラムで十分対応できます。一方で
教師なし学習では、膨大な量のラベルなしデータを扱うため計算能力が必要と
なります。

教師あり学習と教師なし学習の短所

他のテクノロジーと同様に、教師あり学習モデルと教師なし学習モデルのどちらにも短所が
あります。

教師あり学習ではトレーニングに時間がかかることが多く、入力と出力の両方で、
ラベルの検証を行うために人間の専門知識が必要になります。教師あり学習では、
ビッグデータの分類に取り組むことは大きなチャレンジとなりますが、
一度ラベル付けをすれば、その結果は信頼できるものになります。

教師なし学習では、何らかの形で人間が介入し、結果を検証しなければ、
完全に誤った結果となってしまう恐れがあります。教師あり学習とは
対照的に、教師なし学習ではあらゆる規模のデータを
リアルタイムで処理できますが、機械が自ら学習するため、
分類の透明性が低くなり、結果の質が低下する恐れがあります。

教師あり学習と教師なし学習の選択

では、どちらが最適な選択肢といえるのでしょうか。その答えは、
組織のニーズと、それを担当するデータサイエンティストが大量のデータを
どのように評価し、整理しているかという点にあります。組織の
データの処理を行うにあたっては、まず次の点を考慮する必要が
あります。

  • データを検証し、ラベル付き/なしかを評価しましょう。データの検証とラベル作成のための時間や専門知識は十分ですか?またそれらの結果は把握できていますか?
  • 組織が達成したい目標は何ですか?繰り返し起こっている既存の問題を解決したいと考えていますか?それとも、未知の問題を検出して解決するためのアルゴリズムを望んでいますか?
  • どのようなアルゴリズムの選択肢がありますか?組織内で利用できるアルゴリズム、各特徴量の属性や特徴量の数などを把握していますか?これらの特徴量が、データ量やその構造に対して必要なサポートをしているかどうか判断できますか?

教師あり、教師なしどちらのMLアプローチをとるかは、その時の状況、
手元のデータから推測できる基本的な前提条件、最終的な応用方法などによって
決まります。どちらの手法を利用するかは、
組織のニーズが変化するにつれて変わっていく可能性があります。

最初はラベルなしのデータから始め、教師なしアプローチを用いたとしても、
時間の経過とともに正しいラベルを特定できるようになれば、
教師あり学習へと移行することができます。これは、ラベリングの
さまざまな段階で起こりうることです。一方、教師あり学習アプローチでは必要な洞察が
得られない場合に、教師なし学習を用いることで、未知のパターンを発見し、
ビジネスのメカニズムに有用な洞察を得られるようになるかも
しれません。

機械学習を始めてみませんか?

多くの組織にとって、MLの効果的な活用が課題となっています。Alteryx Machine Learning Platformは、強力なノーコード・ローコードのツールで、データ処理を自動化し、
教師ありモデル・教師なしモデルのスムーズな導入をサポートします。Alteryxは、
高度なMLモデルを簡単かつ迅速に構築し、複雑なビジネス上の問題を解決することのできる環境を実現します。今すぐ始めて、
ビックデータを有効活用し、洞察力と予測力を高めませんか?