2020年10月8日木曜日

ディープラーニング その9

 覚書

9章ディープランニングの応用に向けて

9.1 目的の明確化

  • 誰が使うのか

  • どのように使うのか(どのように運用するのか)

  • どういう成果につなげるのか



9.2 データの収集・利用

9.2.1 データの収集

システムの目的に合わせたデータの収集することからスタートする



代表的な共有データセット

データセット

説明

MINST

手書き数字データセット、28ピクセル×28ピクセルのグレースケールの画像で6万枚の訓練データと1万枚のテストデータで構成されている

CIFAR-10

一般物体認識のベンチマークとして使われる画像データセット、6万枚の32ピクセル×32ピクセルの画像で構成され、10個のクラスがラベリングされている

CIFAR-100

CIFAR-10と同様に一般物体認識のベンチマークとして使われる画像データセット。6万枚の画像に100個のクラスがラベリングされており、各クラス600枚ずつの画像で構成されている。

MegaFace

ノイズデータを混ぜた大規模な顔認識データセット

672000人の顔写真が470万枚用意されている

Boston-Housing

ボストンの住宅価格データセット、住宅の平均部屋数や犯罪発生率、税率といった地域情報と住宅価格の関係を定義したもの



9.2.2 データ利用条件

主な知的財産権

権利の種別

権利の性格

著作権

知的財産権の一種であり、美術、音楽、文芸、学術など作者の思想や感情が表現された著作物を対象とした権利である

特許権

知的財産権の一種であり、自然法則を利用した技術的思想の志う作のうち高度のもので、産業上利用できるものについて、一定期間独占的に利用できる権利である

営業秘密

秘密管理性、有用性、非公知性の3つの要件を満たすものを不正競争防止法上の営業秘密という

個人情報

生存する個人に関する情報であって、特定の個人を識別できる情報を個人情報という




9.2.3 著作権法

AI の研究開発に関連する規定として、もともと著作権法第47条がありました。

世界的に見ても AI 開発に対して柔軟な規定でしたが、法改正によりさらに柔軟性を高めました。

改正著作権法では、特に著作物の非享受利用と軽微利用について新たに定められました。

非享受利用

他人の著作物(画像や音楽などのコンテンツ)を視聴者などの知的・精神的欲求を満たす行為を得る目的(著作物を享受する目的)で利用しない場合は、著作権者の同意なく利用が可能となりました。

軽微利用

著作物の利用促進に資する行為で、権利者に与える不利益が軽微である一定の利用を行う場合は、著作権者の同意なく利用が可能となりました



適用例

  • コンピューターを用いて情報解析を行いその結果を提供することができる

  • 情報解析を行う他人のために AI 研究開発用データセット作成・譲渡することができる

  • 情報解析や技術開発など、他人の著作物を享受する目的でなければ著作者の同意がなくとも利用できる



9.3 AI開発の進め方

9.3.1 AIの活用方法

  • AIサービスの活用
    GCP
    IBMのワトソンなどのAPIを利用

  • 機械学習ライブラリまたはツールによる開発
    TensorFlow
    など



9.3.2 開発手法

システム開発における代表的な開発手法にウォーターフォール型とアジャイル型がある。

ウォーターフォールの特徴として

  • 要件不足や認識違いにより手戻りの作業は発生しやすい

  • コストやスケジュールを管理しやすい

が挙げられ。

アジャイル型の特徴として

  • 試行錯誤が必要な開発に適している

  • コストやスケジュールを管理しにくい

  • 仕様変更に柔軟に対応可能

があげられる。

日本において従来のシステム開発のほとんどで採用されているウォーターフォール型は AI 開発と親和性が低いと言われている。

AI 開発時に契約や開発が進まない課題に対して経済産業省は AI ・データ契約ガイドライン検討会を設置し、アセスメント、 POC 、開発、追加学習の四つの段階で契約を締結しながら開発を進める探索的段階型を提唱している。



9.4 AIの運用・保守

9.4.1 信頼性の確保

透明性リポートが各社ので出されている



9.4.2 運用期間中の問題への対応

AI に関して倫理的な問題や価値観の問題が議論されている。

代表的な事例としては
Google
社が開発した Google Photosが黒人男女に対してはカテゴリをゴリラであると判定した事例や
マイクロソフト社が開発したTayがヘイト発言・差別的発言をした事例が大きく問題となった。

また、米国のCOMPASというプログラムが、白人より黒人の再犯率が高いと判定した事例も注目された。



9.5 各国の取り組み

9.5.1 各国の動向

米国政府は2016年の10月と12月に

AI に関する研究開発の重要性と推進のために求められる施策を示した報告書」

AI の社会実装に向けた課題を網羅的に整理した報告書」

AI の社会実装に伴う雇用への影響と経済的インパクトの対応示した報告書」

の三つの報告書が発表され AI の社会実装に向けた具体的な検討が開始されました.



欧州委員会は AI の次期研究及びイノベーションのために研究開発支援プロジェク「HORIZON Europe」についての案を公表しました。2021年から2027年の7年間の研究助成対象とし、現行の欧州最大の支援プロジェクトからさ割2割以上の予算が割り当てられています。

欧州委員会の案では

  • スーパーコンピュータ

  • AI

  • サイバーセキュリティ

  • デジタルスキル

  • デジタル技術

の幅広い利用の保証という五つの分野に焦点が当てられています



ドイツ連邦政府は20187月、 AI の研究開発やり活用においてドイツ及び EU は世界を先導するために取り組むべき事項などを示した AI 戦略の骨子となる文書を公表した。

同文章は、2017年に公表した国家戦略 industrie 4.0の自律システムに関する勧告に基づいて作成されたものです。 AI 研究の強化やスタートアップ企業への投資など、 AI に関してドイツや EU が世界を先導するために取り組むべき13の優先事項を定めています。



20183月にフランスが開催した国際会議で、マクロン大統領はフランスを AI 先進国とするための戦略を発表しました。

同戦略は

  • フランスおよび欧州における AI 英語システムの強化、

  • データのオープン化政策の促進 、

  • AI に関する研究プロジェクトやスタートアップ企業への投資、

  • AI の倫理的政策的課題

4点を柱としてまとめられています



新世代人工知能発展計画は20177月に中国国務院より発表された中国 AI 産業発展の指針であり、2020年から2030年までは三つのステップに分け、今後今後の注目分野や実現目標、 AI 産業市場規模、関連産業市場規模まで細かく規定しています



日本の内閣は2018年に、 Society 5.0 という未来社会ビジョンの実現を目標として掲げている。

経済産業省は、 Society 5.0 を実現するために第4次産業革命技術といわれる 「Iot 、ビッグデータ、 AI 、ロボット」の社会実装が大きな鍵であるとしている。



9.5.2 コミュニティー、サービス

AI やディープラーニングが注目される昨今、技術者を支援するプラットフォームが増えている。

代表的なものとして Kaggleは「コンベンションへの参加」、 Google Scholar は「ウェブ検索による論文・学術誌へのアクセス」、Coursera は「世界の有名大学のオンライン講義の受講」をそれぞれ可能にしている