1.機械学習とは、
コンピュータにデータを学習させ、特徴を導き出し、未来への予測・判断などを活用することです。2.機械学習の分類
- 教師あり学習
- 教師なし学習
- 強化学習
2.1.教師あり学習
正解のわかっているデータ(教師データ)をコンピュータに学習させたのち、未知のデータに対して予測する手法
- クラス分類
- 回帰
2.1.1.クラス分類
アクセス数や年齢などをもとに課金したかどうかを教師データとして与え、課金行動の特徴を学習させておくことで課金してくれる顧客とそうでない顧客を分類できます。
クラス分類は離散値(課金顧客か無課金顧客か)
2.1.2.回帰
顧客情報やイベント費用などに応じた顧客の課金額を教師データとして学習させておくことで、新規イベント開催時に顧客の課金額を予測できます。
回帰は連続値(課金額)
2.2.教師なし学習
教師データを学習させずに与えられたデータから規則性などの意味のある情報を見つけ出す手法です
- クラスタリング
2.2.1.クラスタリング
例
来店する顧客の購入頻度や購入金額などをデータとして与え、顧客をいくつかのグループに分類し、顧客の特徴を把握する
→
分類結果
購入頻度は少ないが、1回当たりの購入金額が大きい顧客グループを特定し、メールやチラシなどで来店を促す施策が可能です
※探索的にデータの規則性を見つけるのには適していますが、正解を定義することは難しく、あくまでも主観的な手法です。
2.3.強化学習
強化学習とは、試行錯誤を通じて「価値を最大化するような行動」を学習するものです。
教師付き学習とよく似た問題設定ですが、与えられた正解の出力をそのまま学習すれば良いわけではなく、もっと広い意味での「価値」を最大化する行動を学習しなければなりません。
例えば、株の売買により利益を得る問題が強化学習にあたります。
この場合、持っている株をすべて売り出せば確かにその時点では最もキャッシュを得ることができますが、より長期的な意味での価値を最大化するには、株をもう少し手元に置いておいたほうが良いかもしれません。
他にも、テトリスでできるだけ高スコアを得るような問題も強化学習の枠組みで考えることができます。
その時点で一番スコアが高くなるのは、一列でもすぐに消すようなプレイ方法ですが、より長期的には、できるだけ溜めてから一度にたくさんの列を消したほうがスコアが高くなります。
2.3.1.強化学習のアルゴリズム
- Q学習
- Sarsa
- モンテカルロ法
#白い富士山