4時間でゲーム制覇 グーグル「驚異の人工知能」手中に
宮本和明 米ベンチャークレフ
米Google(グーグル)は世界最先端の人工知能技術を有し、実際に音声検索などで活用している。そのGoogleが人工知能ベンチャー「DeepMind(ディープマインド)」を買収し、技術強化を加速している。DeepMindに関する情報は限られているが、関連ビデオや論文などから、その輪郭が見えてきた。
DeepMindは驚異的なスピードで自ら学習する人工知能で、Googleは自動運転車などへの適用を視野に入れている。同時に、米国では人工知能が人間を凌駕するとの脅威論が浮上し、安全性に関する議論も活発化している。
DeepMindはロンドンに拠点を置くベンチャー企業で、2010年にDemis Hassabis氏らが創業した。DeepMindが世界を驚かせたのは、ビデオゲームのプレーを見るだけで、驚異的な速度でプレーの仕方を自ら学習高スコアを出す能力を持つことだ。
Googleは2014年1月に同社を買収し、今では「Google DeepMind」として研究開発を進めている。同時に、DeepMindをYouTubeなどのサービスに組み込む作業に着手した。
汎用的に学習できるシステム
Google CEO(最高経営責任者)のLarry Page氏は、トークショーホストのCharlie Rose氏との対談で、DeepMindの機能とGoogleの人工知能戦略について語った(下の写真)。Page氏は、DeepMindは人の手助け無しに驚異的な速さで学習するシステムであると説明した。その結果、ビデオゲームで人間のエキスパートを凌駕するスコアをマークする。

DeepMindは、ビデオゲームごとにソフトウエアを最適化しているのではなく、単一プログラムで異なるゲームに対応できる。かつて、米IBMのスーパーコンピューター「DeepBlue」は、チェスの世界チャンピオンGarry Kasparov氏との対局で勝利を収めたが、それはチェスというゲームに特化した専用システムだった。
これに対し、DeepMindはゲームの種別に依存せず、汎用的に学習できる点が最大の特徴である。
2時間で「人間超え」
DeepMindが実際にゲームをプレーしているデモを見ると、その学習能力の凄まじさが分かる。下の写真はHassabis氏があるカンファレンスで、DeepMindが「Breakout」(ブロックくずし)ゲームを学習していく過程を解説している様子である。これは、バーを操作し、ボールを打ち返してブロックを崩していくゲームで、DeepMindは最初はゆっくりとプレーを学ぶ。

1時間で200回程度のゲームをこなすと34%の割合でボールを打ち返し、人間の初心者程度の実力となる。2時間後には300回のゲームをこなし、既に人間の技量を上回る。
4時間後には、ブロックに通路を開け、裏側からブロックを崩すという大技を自ら学習する。DeepMindは4時間でゲームをマスターする。このようにDeepMindは、恐ろしいほど高速に学習する。
7本のゲームでベンチマーク
DeepMindは、同システムがゲームを学習する手法を論文(「Playing Atari with Deep Reinforcement Learning」)で公表している。この中では、システムがゲームを学習するメカニズムやベンチマーク結果についての考察を紹介している。
DeepMindのシステムはセンサーからのインプット(入力)を受け、制御ポリシーを学習し、ポイントが最大になると思われる操作を行う。つまり、システムはゲーム画面を見て、得点を得るよう、自らプレー方法を学習する。当然のことながら、ゲームソフトウエアを「リバースエンジニアリング」して、ゲーム進行のメカニズムを把握しているわけではない。
具体的にはアーケードゲームを学習するフレームワーク「Arcade Learning Environment」を利用し、米Atariが開発したゲーム7本を使ってベンチマークを実施した。その結果、ゲームごとにアーキテクチャーやアルゴリズムを変更しなくても、システムが広範囲のゲームを自ら学べる能力が実証された。
人間のエキスパートをも凌駕
DeepMindは、人間のゲームエキスパートを凌駕する結果を示した。下の表が評価結果の一部で、ゲームごとに得点が示されている。最上段がゲームの種類で、左コラムが挑戦者名である。「DQN」がDeepMind、「Human」が人間のエキスパートを示す。その他は、既存のゲーム学習システムである。

DeepMindは、既存のゲーム学習システムに圧勝しただけでなく、「Breakout」(ブロックくずし)、「Enduro」(カーレース)、Pong(ポン、卓球ゲーム)では、人間のエキスパートを凌駕した。前述のブロックくずしでは、人間のエキスパートが獲得した得点の5.4倍となり、圧倒的な技量を示した。
論文によると、DeepMindはDeep Learningの一手法「Convolutional Neural Network」 と学習モデル 「Reinforcement Learning」を組み合わせたシステムである。
Convolutional Neural Networkとは、脳の構造をモデルとしたネットワークで、イメージなどから特徴量を抽出するために使われる。一方、Reinforcement Learningは、ある環境下(ゲームなど)で、行動を起こし(ゲームを操作し)、それに対するフィードバック(得点など)で学習する手法を指す。
ビデオゲームでは、ボタンを操作してからそれが得点につながるまで、長いステップを要する。操作と得点の関係が時間的に離れているので、どの操作が正しいかの判定が難しい。DeepMindは、ビデオイメージから特徴量を抽出し、人間や動物のように試行錯誤を重ねて学習するシステムと言える。
Google製品に導入へ
GoogleのPage氏は上述の対談で、「今のコンピューターは機能していない」と繰り返し説明した。コンピューターは利用者に関するコンテクスト(状況)を把握していないという意味で、これには根本的な改良が必要と述べている。
人工知能は改革のカギであり、久しぶりにエキサイティングな技術に出会ったとも述べている。ニューロサイエンスとコンピューターサイエンスが結びつくことで、新しい分野が生まれ、Page氏は人工知能開発でブレークスルーが起こっていることに期待を寄せている。
また同氏は、DeepMindをGoogleの製品/サービスに適用するプロジェクトを展開していることを明らかにした。その一つが検索エンジンで、DeepMindで利用者の意図を学び、最適な情報を提示することを目指している。また、YouTubeの動画推奨機能や、モバイル音声検索機能などにDeepMindを適用する計画だ。数年以内に機能強化されたシステムが登場するとしている。
今後5~10年で生活に浸透
一方、Hassabis氏は英BBCとのインタビューで、DeepMindの応用分野やロードマップについて述べている(下の写真、左側がHassabis氏)。Deep Learningという手法は、今後5年から10年のレンジで、生活の様々な分野に入ってくるとしている。

家庭向けロボットは、家の中を掃除したり家事をすることを想定しているが、ここにDeepMindを適用すると自律的な意思決定が可能となる。現行ロボットはプログラム外の事象に遭遇するとうまく対応できないが、DeepMindを搭載すれば自らが驚異的な速度で学習を重ね、幅広い事象への対応が可能となる。
現在、自動運転車の開発・テストが世界的に進められているが、ここにDeepMindを適用すると、輸送システム全体が革新的に変化する可能性を秘めている。
Hassabis氏が最も期待しているのは科学技術への応用だ。マクロ経済、気象、医学、エネルギー分野に適用すると、人工知能が人間の科学者に代わって研究するモデルが可能となる。
今は優秀な科学者が大量に生成されるデータを元に研究を重ねているが、人間が学習できる範囲には限界がある。DeepMindは大量のデータを学習し、人間の研究者に代わって、研究開発を行う構想を描いている。DeepMindが研究を重ねれば、人間が研究するより科学技術の進化が早まると期待している。
「今後5年以内に問題が起こる」
一方、人工知能が驚異的な速度で学習することに対して、恐怖を覚える人々も登場してきている。米Teslaや米SpaceXの創業者であるElon Musk氏はWebサイトで、人工知能は深刻なリスクを内包し、5年以内に問題が起こると述べている。
人工知能が人間の知能を上回り、「スーパーインテリジェンス」が世界を制覇するという危機感の表れである。Musk氏は繰り返し問題点を指摘しているが、その根拠の一つがDeepMindにある。DeepMindが驚異的な速度でゲームを学ぶことを見て、危機感を抱いたとされる。
さらに、インターネットには膨大な"教材"がそろっており、人工知能が学習できる環境がある。Musk氏はこれを悪用することに対する懸念も表明している。悪意のあるものがここに逃げ込み、学習を重ねることを阻止する必要があると述べている。
ちなみにMusk氏もDeepMindに出資しており、危険性を高める側にいるのも事実である。同時に、人工知能の威力を把握しているため、このような発言につながったとみられている。
「知能の爆発」が起こる
Musk氏に代表される人工知能脅威論に対し、反対意見を唱える人も少なくない。未来学者のRay Kurzweil氏は、Musk氏の発言を受け、人工知能を安全に利用する方法に言及し、人工知能脅威論にくぎを刺している。
実は、人工知能脅威論の源流はKurzweil氏の著書「The Singularity is Near」に遡る。この著書は、2029年に人工知能がヒトの頭脳を上回り、2045年にはSingularity(特異点=知能の爆発)に達するという内容で、社会に大きな波紋を投げかけた。筆者はKurzweil氏の講演会でこの説明を聞いたが、そのときの強烈なインパクトを今でも鮮明に覚えている。
危険を制御しながら開発続行
このKurzweil氏だが、人工知能に対する立ち位置は科学的で、現実的な対応策を提言している。同氏は人工知能脅威論に関し、バイオテクノロジーが参考になるとしている。バイオテクノロジーが登場した当時、遺伝子組み換え技術により、バイオテロを含む危機感が社会にまん延した。このため、1975年に歴史に残る学会(「Asilomar Conference」と呼ばれている)が招集された。この学会でバイオテクノロジーの危険性を評価し、安全性を保証する方針が議論された。
人工知能もこれを参考に、プロジェクトのミッションを定義し、不正使用を防止するための対策が求められるとしている。事実、人工知能学会は、人工知能が社会に与える影響を精査する会議を2009年に同じ場所で開催している(下の写真)。

この会議はEric Horvitz氏(Microsoft研究所)が主催し、Sebastian Thrun氏(Google自動運転車開発)やAndrew Ng氏(YouTubeで猫の概念を学習)など、名だたる研究者が出席している。つまり、人工知能は原子力のように危険性も含んでいるが、人間は安全に管理するすべも知っているという主張である。
米国で高まる「脅威論」
DeepMindのような驚異的な速度で学習するアルゴリズムに接すると、技術進化に対する大きな期待を抱くとともに、恐怖感を抱く人々が登場する。人工知能が人類を破滅させるというのは永遠のテーマであり、映画「ターミネーター」などにも描かれている。
今の米国社会では、人工知能に対する脅威論が広まりつつあるようにも感じる。危惧を抱く人々にいかに対応するかが、IT(情報技術)企業の新しい課題になる。
ちなみにHassabis氏は、買収条件の一つとしてGoogleが社内に倫理委員会を設立することを求めた。GoogleがDeepMindを既存サービスに統合する際に、人工知能の使用目的が社会倫理に反していないかを、公平に審査するメカニズムの制定を求めたものと思われる。
さらに、同氏はGoogleがDeepMindを軍事目的で利用しないことも要求した。開発した本人が、そのメリットだけでなく、社会に与えるインパクトの大きさを一番理解しているからである。
米ベンチャークレフ代表 1955年広島県生まれ。1985年、富士通より米国アムダールに赴任。北米でのスーパーコンピューター事業を推進。2003年、シリコンバレーでベンチャークレフを設立。ベンチャー企業を中心とする、ソフトウエア先端技術の研究を行う。20年に及ぶシリコンバレーでのキャリアを背景に、ブログ「Emerging Technology Review」で技術トレンドをレポートしている。
[ITpro 2015年1月27日付の記事を基に再構成]
関連企業・業界