深層学習とGoogleの深い関係 / 岩本 元

 最近、人工知能という単語を見聞きすることが多いです。いわゆる第三次AIブームです。AIブームの切っ掛けは、2009年に機械学習の代表システムであるIBMのワトソンがクイズ番組でチャンピオンに勝利したことです。機械学習とは、世の中の特定の事象におけるデータを分析して特徴を抽出・定義し、その傾向から統計手法を用いて判断や予測を行うことです。機械学習の課題には、特徴の抽出・定義やその後の統計手法の選択、チューニングを人間が行う負担(コスト)が大きいことです(教育あり機械学習)。

 そして、2016年1月、深層学習(ディープラーニング)を応用したGoogleのアルファ碁が囲碁の世界チャンピオンに勝利したことでブームが一気に過熱しました。深層学習は機械学習の1種ですが、ニューラルネットを用いてデータから特徴を自動抽出します。人間がニューラルネットを定義し、コンピュータがデータを用いてそのニューラルネットを自動的にチューニングします(教育なし機械学習)。

 

 深層学習を適用することで、画像認識処理と音声認識処理の精度が大きく向上します。現時点において、深層学習を用いた画像認識の能力は人間並み、音声認識の能力は人間をやや下回ると言われています。一方、深層学習は自然言語処理には向いておらず、従来の機械学習の方が精度は高いそうです。パーソナルエージェントSiriやワトソンの会話・質問応答では、口頭質問の音声認識に深層学習が使用され、その後の回答探索には従来の機械学習が使用されています。

 深層学習のためのソフトウェアやハードウェアも次々と登場し、導入のハードルは下がっています。ソフトウェアには、深層学習のフレームワーク(ソフトウェアの部品集)のCaffe他があり、GoogleからはフレームワークTensorFlowが提供されています。TensorFlowは分散処理に対応しており、深層学習を高速化することができます。これらはオープンソースとして無償公開されています。ハードウェアでは、高性能の画像処理プロセッサGPUの使用が一般的ですが、より高性能のFPGAも使用されるようになっています。また、Googleは深層学習専用のプロセッサTPUを提供しています。同社の機械学習のクラウドサービス Cloud Machine LearningにもTensorFlowやTPUを組み込みつつあります。

 一方で、ニューラルネットの定義やシステム開発において深層学習を取扱うことのできる人材は大幅に不足しています。Googleを始めとする米国企業やトヨタ、リクルートが人材獲得競争を繰り広げています。ITエンジニアにとってはキャリアアップのチャンスかも知れません。

 

 試しに、私が過去1年間にGoogle Photosへ格納した写真を「カレー」というキーワードで検索したところ216個がヒットしました。その中でカレーではなかったものは9個でした(適合率95.8%)。また、カレーの写真は実際には305個あり、98個が検知漏れでした(再現率67.8%)。詳細に見ると、カレールーだけの写真、トンカツ等のトッピングのあるカレーライス、多くの具材が付いているスリランカ風カレーなど、様々な種類の写真が検知されました。誤検知の写真9個は、(カレーラーメンではありませんが)色がカレーに似たラーメンと麻婆豆腐でした。それらの写真を初めて見る人間でも判断が困難です。一方で検知漏れの98個には、カレーが小さく写っているもの、暗い場所で写したもののように人間でも判断が難しいものもありますが、同様の他の写真は検知されているものもあります。深層学習の特徴の1つとして、自動的にチューニングされ、性能を確定できないことがあります。

 Googleは、この機能を用いたユーザーの撮影写真の被写体、Google検索におけるキーワード、Google Mapにおける訪問地などの情報からユーザーの嗜好を知り、各人にマッチする広告を提示する事業で年間約7兆円の売上げを得ています。

 

 Googleは、深層学習を用いた自動運転車の開発も進めています。先日、Googleの自動運転車の公道走行距離が320万kmを突破したことが公表されました。既に山道の走行、工事現場の通過や自転車の飛び出しなど様々なシチュエーションに対応することができます。Googleはトヨタ、アウディ、クライスラー他に技術提供し、車両自体の開発を依頼しています。GMやBMWは他のIT企業と提携して自動運転車の開発に乗り出し、トヨタはUberの自動運転車開発に投資すると共に、米国に研究所を設立して自社開発にも取り組み始めました。大きく先行している点と、Google Mapのような詳細な地図データを持っている点ではGoogleが有利でしょう。

 

 深層学習で強化する機械学習の将来の応用分野は他にも多くあります。特に人間の代わりに家事や介護を行うロボットや交通機関の自動運転の需要は、少子高齢化が加速する日本において極めて高くなり、今後大きな市場になると思います。

 

(参考)

・第三次AIブームは実用的システムを産み出せるのか?(馬塲孝夫)

 <http://www.itc-kyoto.jp/2016/06/06/第三次AIブームは実用的システムを産み出せるのか-馬塲孝夫/>

・人工知能 (AI) はどこまで進歩しているのか 4つの知能レベルと実商品例

 <http://blog.btrax.com/jp/2015/11/09/artificial_intelligence-01/>

・Wikipedia:深層学習(ディープラーニング)

 <https://ja.wikipedia.org/wiki/ディープラーニング>

・一般向けのDeep Learning

 <http://www.slideshare.net/pfi/deep-learning-22350063>

・Googleが画像の説明文章を自動生成する技術を開発

 <http://gigazine.net/news/20141119-google-automatically-caption/>

・Wikipedia:自動運転車(セルフドライビングカー)

 <https://ja.wikipedia.org/wiki/Google_セルフドライビングカー>

・ Googleの自動運転カーは複雑な交通状況の市街地でもすでに実用レベルの自動走行が可能

 <http://gigazine.net/news/20140430-google-car-master-street/>

 

------------------------------------------------------------------------

■執筆者プロフィール

 岩本 元(いわもと はじめ)

 

 ITコーディネータ、技術士(情報工学部門、総合技術監理部門)

 &情報処理技術者(ITストラテジスト、システムアーキテクト、

          プロジェクトマネージャ、システム監査他)

 企業におけるBPR・IT教育・情報セキュリティ対策・ネットワーク構築のご支援