IT

3つの機械学習をわかりやすく解説!

ロボット



「機械学習って何だろう?」と思っている方のために、3つの機械学習について解説します。

「機械学習の前提知識が何も無い」という人向けの記事です。

それではどうぞ。

機械学習とは?

機械学習は、人工知能(AI)を作るための方法のひとつです。

人工知能は、人間と同じように、物事に対して様々な判断を下すことができます。

この判断能力を与える方法が機械学習です。

機械学習には、ディープラーニングなど様々なアルゴリズムがあります。

分類

機械学習には、大きく分けると次の3タイプがあります。

 

  • 教師あり学習
  • 教師なし学習
  • 強化学習

 

順に見ていきます。

 

教師あり学習(Supervised Learning)

教師あり学習は、問題の答えをあらかじめ用意しておく学習方法です。

答え(特徴)を先に教えておけば、後から似たようなデータが与えられた時に正しい答えを導き出すことができます。

例えば、お互いに関連性のある2つのデータを用意します。

 

データ①:「ピンク色」「40kcal/100g」

データ②:「桃」

 

以上のデータをあらかじめ与えておけば、後で新しいデータ③(「ピンク色」「40kcal/100g」)を機械に入力した時に、「桃」と予測することができます。

「それがどんな物であるか」を表現するデータ①を特徴量あるいは説明変数と呼び、「答え」に当たるデータ②をラベルあるいは目的変数と呼びます。

また、データ①とデータ②がペアになったものをデータセットと呼びます。

教師あり学習の簡単な仕組みは以上になります。

 

教師あり学習の細かい分類

教師あり学習を細かく分類すると次の2つに分かれます。

 

① 分類問題……カテゴリを予測する

② 回帰問題……大小関係・数値を予測する

 

① 分類問題

分類問題はその名の通り、カテゴリを予測する問題です。

カテゴリというのは、例えば、男/女のような性別だったり、犬/猫のような動物の分類だったりですね。

2つのカテゴリのうちどちらかに分類するので、二値分類といいます。

 

しかし、実際にはカテゴリはもっと複雑ですよね。

男/女のようなシンプルな分類ではなく、男/女/LGBTのような三値で分類することが好ましいケースです。

あるいは、犬/猫/兎/狸のような四値が必要なこともあります。

ということで、2つより多くのカテゴリに分類される場合は多値分類と呼んで、二値分類と区別します。

 

まとめると、分類問題は、

 

二値分類……答えが2パターン

多値分類……答えが3パターン以上

 

の2種類があるということですね。

 

② 回帰問題

回帰問題とは、犬/猫のようなカテゴリではなく、数値の予測が問題になる場合です。

例えば、桃の入荷数と売上に関する表があるとします。

 

入荷数 売上
500 70000
350 40000
400 50000

 

この時、「入荷数450なら売上はいくらになるか?」ということを予測するのが回帰問題です。

ポイントは、分類問題と違って、与えられたデータにない数値も予測できることです。

なので、データを入力した結果、売上が60000と予測されることも十分ありえます。



教師なし学習(Unsupervised Learning)

教師あり学習の項で特徴量と目的変数という2つの言葉を紹介しました。

特徴量と目的変数があらかじめデータセットとして与えられることで、未知の変数の予測が可能となるのでしたね。

一方、教師なし学習では、目的変数を与えず特徴量のみからデータの構造を予測させます。

教師なし学習の分析方法は、大きく次の2つがあります。

 

① クラスタリング

② 次元削減

 

 

クラスタリング

クラスタリングは、一言で言うと、グループ分けです。

 

データ①:赤
データ②:青
データ③:赤
データ④:青

 

以上のデータから、「データ①・データ③を同じグループ」「データ②・データ④」を同じグループとして機械に予測させます。

このように、与えられたデータから共通の構造や特徴を抽出してグループ化することをクラスタリングと言います。

 

次元削減

その名のとおり、次元を削減し、より少ない特徴量でデータを判断する方法です。

例えば、山田くんのテスト結果があるとします。

 

科目 点数
数学 80
理科 92
国語 34
英語 68

 

私たち人間はこの表から「山田くんは理系科目が得意だ」と判断できますよね。

これが次元削減のイメージです。

 

次元削減のプロセス

「理系科目が得意」と判断する時、何が起きているでしょうか。

おそらく、次の値を比較しているはずです。

 

(国語と英語の平均点)<(数学と理科の平均点)

 

言い換えると、

 

(文系科目の点数)<(理系科目の点数)

 

ですね。

ここで注目して欲しいのは、4次元(数学、理科、国語、英語)データが2次元(文系科目、理系科目)になっていることです。

このように「簡略化して(まとめて)比較する」という作業を私たちは頻繁にやっています。

次元削減では、機械にも私たちがやっているのと同じようなプロセスを実行させます。

 

次元削減の補足例

次元削減はややこしいので、もうひとつ例を紹介。

例えば、花子さんという女性がいるとして、その特徴が3次元だとします。

 

  • 肌が綺麗
  • かわいい
  • スタイルがいい

 

ここから花子さんを表す1次元データ「美人」を取り出すのも次元削減です。

「たくさんあるデータをシンプルに表現する」という点はテストの例と変わっていないことを確認してください。

 

強化学習(Reinforcement Learning)

はじめに、3つの言葉を知っておくと理解しやすくなります。

 

  • 環境
  • エージェント
  • 報酬

 

強化学習とは、ある環境の中で、一連の行動(試行錯誤)を通して報酬を最大化するための方策をエージェントに学習させることです。

ややこしいので、具体的に置き換えます。

シューティングゲームを例にとります。

 

  • 環境=遊んでいるシューティングゲーム
  • エージェント=ゲームを遊ぶプレイヤー
  • 報酬=1体撃破で+1点、1撃撃破で+10点

 

上の条件があるとして、シューティングゲーム(環境)でプレイヤー(エージェント)がスコア(報酬)を最大化するために試行錯誤をするのが強化学習です。

 

強化学習のメリット

データが必要ない(エージェントが自分で探す)というのが大きな強みです。

 

強化学習の参考動画

わかりやすい例です。

私たちが徐々に自転車の乗り方を覚えるように、人工知能が次第に上達していく様子が分かります。

 

まとめ

ロボットの手

簡単にですが機械学習の基礎について説明しました。

 

  • 教師あり学習
  • 教師なし学習
  • 強化学習

 

以上の3つは様々な技術で研究が進んでいます。

機械学習は自動運転や自動翻訳、レントゲンの画像解析など様々な方面に応用が効く技術です。

日常でも、「このAIはどの学習方法が使われているのだろう?」と想像してみると、知識の幅が広がりますね。



ABOUT ME
てりたま
いつの間にかライターで生きるようになっていた人。真面目半分、不真面目半分で記事を書いてます。