教師あり学習と教師なし学習の違いとは

教師あり学習と教師なし学習は、異なるアプローチにより、企業と消費者をより密接に結びつけます。ここでは、その違いと仕組みについて説明します。

スマートテクノロジーは、日常生活のほぼすべての場面に浸透し、あらゆるところに存在しています。 より多くの情報や自動化を、クリックのみで利用できることが期待されており、 こうした状況に対応するために、企業は常に最新のテクノロジーを導入し、活用していく必要があります。

ビジネスにおける人工知能(AI)の進歩は、こうしたニーズをさらに高めています。指紋や顔のスキャンを生体認証データに変換してドアやスマートフォンのロックを解除するセキュリティシステム、異常な購買パターンを検出して自動でアラートを送信し、人間による取引確認を可能にする銀行のシステム、自然言語処理を活用して音声を処理し、さまざまな問い合わせに応答するスマートフォンの音声アシスタントなど、優れたテクノロジーが次々と登場しています。これらは、機械学習(ML)アルゴリズムを活用し、常に進化し続けています。

機械学習はAI(人口知能)の一分野であり、特にデータから学び、改善を繰り返す能力をシステムに与える応用技術です。人間が日常の経験から学んでいくように、機械学習も複数回の反復を通じて予測力や精度を徐々に向上させていきます。MLモデル(機械学習モデル)の学習データは、IoTデバイス、取引記録、ソーシャルメディアなどから収集されます。また、データサイエンスのアルゴリズムを活用し、収集した情報をさまざまなパラメータに基づいて選別・分類・グループ分けします。こうしたデータを組み合わせることで、人間の特定の行動パターンを正確に予測し、それに応じて応答するモデルを作成することが可能になります。

たとえば、お客様が携帯電話の買い替えを検討しており、インターネットで候補を絞り込んでいる際に、他の携帯電話や関連するアクセサリーをおすすめしたりすることができます。 こうした応答モデルは、過去の類似商品の購買データに基づいて作成されており、これによって他の消費者が同様の情報を得た上で、商品を選択できるモデルを作成することができます。

ML のアルゴリズムには「教師あり型」、「教師なし型」、「強化型」の 3 タイプがあります。 強化学習では、機械に一連の決定を行うよう学習させます。 教師あり学習と教師なし学習の一番の大きな違いは、 教師あり学習では「ラベル付きデータセット」を使用し、教師なし学習では「ラベルなしデータセット」を使用することです。 「ラベル」は、データにすでに正しい答えがタグ付けされていることを意味します。

Alteryxブログ内のインライン広告

分析を変革

データに潜むインサイトを引き出しませんか?

無料トライアルを開始

教師あり学習

ML の教師あり学習では、ラベル付きデータセットを用いて、データを分類したり、結果正確に予測したりするためのアルゴリズムを学習させます。 このモデルでは、ラベル付きデータを使用してさまざまな特徴量の関連性を測定し、既知の結果に対するモデルの適合性を改善させていきます。 教師あり学習は、主に 2 つのタイプに分けられます。

  • 分類:「分類」では、アルゴリズムを用いてデータを特定のセグメントに分類します。身近な例として、メール受信トレイの迷惑メールを拒否するアルゴリズムや、ソーシャルメディア上のユーザーをブロック・制限するアルゴリズムなどがあります。一般的な分類のアルゴリズムには、ロジスティック回帰、K近傍法、ランダムフォレスト、単純ベイズ、確率的勾配降下法、決定木などがあります。
  • 回帰: これは、アルゴリズムを用いて、1 つの従属変数と 1 つまたは複数の独立変数の関係を測定する統計・ML 手法です。回帰モデルでは、多様なデータの、因果関係を予測することができます。たとえば、ビジネスでは、広告収入の成長軌道の予測などに利用できます。 一般的な回帰アルゴリズムには、リッジ回帰、ラッソ、ニューラルネットワーク回帰、ロジスティック回帰などがあります。

 

教師なし学習

教師なし学習では、ML アルゴリズムを使ってラベルなしのデータセットを調査・グループ化します。 このようなアルゴリズムは、人間の介入や監視なしで、データの未知のパターンを明らかにすることができます。 アルゴリズムには、主に 3 つのカテゴリがあります。

  • クラスタリング:クラスタリング手法を用いることで、類似点や相違点に基づき、ラベル付けされていないデータをグループ化できます。例えば、市場のセグメント化を行う場合に、K平均法のアルゴリズムを用いると、類似したデータポイントを一連のパラメータを表すグループに割り当てることができます。こうしたグループ化は、場所、所得のレベル、購入者の年齢などの変数に基づいて行うことができます。
  • 関連付け: データセット内の変数の関係性を特定したい場合には、教師なし学習の関連付けの手法が役に立ちます。例えば「この商品を見た人はこんな商品も見ています」という表示などの、レコメンド機能に最適な手法です。例えば、15 人のお客様が携帯電話の購入時に、ヘッドホンも併せて購入した場合、 このアルゴリズムを通じて、ショッピングカートに携帯電話を入れたお客様全員にヘッドフォンがおすすめされるようになります。
  • 次元削減:データセットには、異常に高い特徴量が含まれる場合があります。こうしたケースにおいて、次元削減は、データの整合性を損なうことなく、異常な特徴量の数を減らすのに役立ちます。次元削減は、データの処理前によく用いられる手法であり、例えば、画像からノイズを除去し、鮮明度を高めるといったケースに利用されています。

 

教師あり学習と教師なし学習の違い

教師あり学習・教師なし学習の原則を理解すると、両者の違いを簡単に理解できるようになります。

これらの 2 つのアプローチの最大の違いは「ラベル付きデータセット」であるか、「ラベルなしデータセット」であるかという点です。 教師あり学習では、分類アルゴリズムや予測アルゴリズムの学習において、ラベル付きデータセットが用いられます。 ラベル付けされた「学習」用のデータが入力されると、そのデータのさまざまな特徴量の優先順位が、モデルが望ましい結果にうまく適合するまで繰り返し調整されます。 教師あり学習モデルでは、他のアプローチに比べ、はるかに高い精度が期待できますが、 情報のラベルが適切であることを確認するために、人間がデータの処理工程に関与する必要があります。

たとえば、教師あり学習モデルでは、空港での混雑時間、空路の渋滞、気象条件などのパラメータに基づいてフライト時間を予測することができますが、 その際には人間が手作業でデータセットにラベルを付けをおこない、これらの要因がフライトのタイミングにどのように影響するかをモデルに学習させる必要があります。 教師ありモデルでは結果を知っているからこそ、雪がフライトの遅れの要因であると結論づけることができるのです。

一方で、教師なし学習モデルは人間の介入なしで動作し、ラベル付けされていないデータを使って独自に何らかの構造を見出します。この場合、人間が行うのは出力変数の検証だけです。例えば、オンラインで新しいノートパソコンを購入しようとする際、教師なし学習モデルはその購入検討者が、関連商品を一緒に購入する傾向のある購買者グループに属していることを見抜きます。しかし、パソコンケースや画面保護フィルム、車用充電器といった選択肢を推奨する仕組みの検証は、データアナリストの役目となります。

結果とインサイト

教師あり学習と教師なし学習の目標は異なります。前者は新たに導入されたデータの結果を予測することを目的とし、後者は大量の新規データから新たな知見を得ることを目的としています。 教師あり学習では、どのような結果が得られるかがあらかじめ分かっているのに対し、教師なし学習では、新しい未知なるものを発見していくことになります。

多様なアプリケーション

教師あり学習で作成したモデルは、スパム検の出や感情分析の処理、 天気予報や価格変動の予測などに適しています。 一方で、教師なし学習は、あらゆるタイプの異常や外れ値を探すのに最適です。 また、教師あり学習は、レコメンデーションエンジンや、顧客プロファイルの理解にも適しています。

多様な複雑さ

教師あり学習で ML モデルを作成する場合、必要なツールは非常にシンプルで、多くの場合において R や Python のようなプログラムで十分対応できます。 一方で教師なし学習では、膨大な量のラベルなしデータを扱うため計算能力が必要となります。

教師あり学習と教師なし学習の短所

他のテクノロジーと同様に、教師あり学習モデルと教師なし学習モデルのどちらにも短所があります。

教師あり学習ではトレーニングに時間がかかることが多く、入力と出力の両方で、ラベルの検証を行うために人間の専門知識が必要になります。 教師あり学習では、ビッグデータの分類に取り組むことは大きなチャレンジとなりますが、一度ラベル付けをすれば、その結果は信頼できるものになります。

教師なし学習では、何らかの形で人間が介入し、結果を検証しなければ、完全に誤った結果となってしまう恐れがあります。 教師あり学習とは対照的に、教師なし学習ではあらゆる規模のデータをリアルタイムで処理できますが、機械が自ら学習するため、分類の透明性が低くなり、 結果の質が低下する恐れがあります。

教師あり学習と教師なし学習の選択

では、どちらが最適な選択肢といえるのでしょうか。その答えは、組織のニーズと、それを担当するデータサイエンティストが大量のデータをどのように評価し、整理しているかという点にあります。 組織のデータの処理を行うにあたっては、まず次の点を考慮する必要があります。

  • データを検証し、ラベル付き/なしかを評価しましょう。データの検証とラベル作成のための時間や専門知識は十分ですか?またそれらの結果は把握できていますか?
  • 組織が達成したい目標は何ですか?繰り返し起こっている既存の問題を解決したいと考えていますか?それとも、未知の問題を検出して解決するためのアルゴリズムを望んでいますか?
  • どのようなアルゴリズムの選択肢がありますか?組織内で利用できるアルゴリズム、各特徴量の属性や特徴量の数などを把握していますか?これらの特徴量が、データ量やその構造に対して必要なサポートをしているかどうか判断できますか?

教師あり、教師なしどちらの ML アプローチをとるかは、その時の状況、手元のデータから推測できる基本的な前提条件、最終的な応用方法などによって決まります。 どちらの手法を利用するかは、組織のニーズが変化するにつれて変わっていく可能性があります。

最初はラベルなしのデータから始め、教師なしアプローチを用いたとしても、時間の経過とともに正しいラベルを特定できるようになれば、教師あり学習へと移行することができます。 これは、ラベリングのさまざまな段階で起こりうることです。 一方、教師あり学習アプローチでは必要な洞察が得られない場合に、教師なし学習を用いることで、未知のパターンを発見し、ビジネスのメカニズムに有用な洞察を得られるようになるかもしれません。

機械学習を始めてみませんか?

いまだに多くの組織がMLを十分に活用できていないのが現状です。Alteryx Machine Learning Platformは、強力なノーコード・ローコードツールで、データ処理を自動化し、教師あり・教師なしモデルのスムーズな導入をサポートします。Alteryxは、高度なMLモデルを簡単かつ迅速に構築し、複雑なビジネス上の問題を解決できる環境を提供します。今すぐAlteryxを使い、ビッグデータを有効活用して、洞察力と予測力を高めませんか?