第2章 人工知能をめぐる動向
2.1第一次AIブーム
第一次 AI ブームは探索と推論の時代と呼ばれてます。
人間の知能を探索を繰り返すことで実現しようとしました。しかし探索の手法では複雑な問題を考えると膨大な試行回数が必要となり実現できませんでした。そのため次第にブームは下火となっていきました。
第1次 AI ブームでは迷路やパズルなどのおもちゃのような問題(トイ・プロブレム)は解くことは出来ましたが、日常の様々な問題を解決することはできませんでした
2.2 第二次 AI ブーム
第二次 AI ブームは知識の時代と呼ばれます。人工知能を人間の知識をプログラムすることで実現しようとしました。医療分野にも登場しましたが精度や倫理、 AI に対する理解の問題などで大きな活躍をするに至りませんでした。また精度を上げるためには膨大な量の知識をプログラミングする必要があり第2次 AI ブームも次第に下火になってきました。
知識と条件分岐によって問題を解く AI をエキスパートシステムと言います。代表的なエキスパートシステムとして血液疾患の患者を診断するMYCINや、人間とテキストで対話を行うことができるELIZAがあります
ENIACやABC は世界で最初のコンピューターの名前です。
ELIZAは人間と対話できる AI で
MYCINは血液疾患の患者を診断するなど医療分野で有名になりました
エキスパートシステムで知識の言語化共有が難しくなってくるとオントロジーの研究が盛んになってきています。
オントロジーとは哲学用語で存在論を意味する単語で人工知能の分野では概念化の明示的な仕様と定義されています。オントロジーにおいて概念間の関係を表す用語で上位概念と下位概念との関係を表すpart-ofの関係があります。is-asの関係は推移律が成立します
2.3 第三次 AI ブーム
ニュートラルネットワークは人間の脳が学習する仕組みを模倣しようと人間の脳の神経回路を模して作られました。学習用データからパラメータを調整しながら統計的に学習します。そのため学習には大量のデータが必要になるという特徴があります。 Cloud や IoT などの発展で簡単に多くのデータを収集管理できるようになったこともニューラルネットワークの活躍するようになった理由の一つです。
MNISTとは0~9までの白黒の手書き数字データーです。6万枚の訓練データ、1万枚のテストデータから構成されます。実際のデータ1件はラベルデータ(その画像が0~9のどの数字を表しているかの解答)と画像28×28=784ピクセル画像とし、1ピクセルあたりの色の濃淡を0~255までの数字で表した785桁のデータで構成されます
ニューラルネットワークは入力層、隠れ層。出力層の三つの層で構成されます。入力層の数は学習用データの列数と同じ数になります。MNISTデータを学習する場合は784個の入力層を作る必要があります。出力層はMNISTデータのように多クラス分類問題の場合は分類したい種類の数と同じになります。0~9なので10個の出力層が必要となります。隠れ層の数は一層には決まらず学習データによって最適な個数や層数を割り出す必要があります
ニューラルネットワークの隠れ層を多層としたものを ディープラーニングと呼びます。
ilsvrc という画像認識のコンテストで圧勝し一躍有名となりました。2015年には画像認識において人間の認知を超え、今後も様々な分野での活躍が期待されています。ディープランニング自体も発展を続けており、画像認識に特化した CNN や言語解析などの時系列データに特化した RNN など、各分野に特化したディープラーニングの開発が進められています