2019年1月19日(土)

グーグルAI、囲碁の次は3Dサッカーゲームを攻略

2016/6/23 6:30
保存
共有
印刷
その他

VentureBeat

米グーグルの子会社ディープマインドの人工知能(AI)が非常に賢いのは証明済みだ。ディープマインドの囲碁AI「アルファ碁」は今年、トップ級のプロ棋士である韓国の李世●(石の下に乙、イ・セドル)氏を破り、世界中から注目を浴びた。その前にも、ブロック崩しゲームや3D(3次元)迷路を攻略している。

■アマゾン/アップル/フェイスブック/マイクロソフトがライバル

グーグルのAIは3Dサッカーでゴールするようキャラクターを訓練している

グーグルのAIは3Dサッカーでゴールするようキャラクターを訓練している

今度は、さらに多面的な分野に目を向けている。ディープマインドは17日、突拍子もないようでいて、実はグーグルのAIの威力を証明する新たな芸当を明らかにした。この実験では、サッカーボールを蹴ってゴールに入れるように小さなキャラクターを訓練する。アマゾンやアップル、フェイスブック、マイクロソフトなど他の大手IT(情報技術)各社もこぞってこの分野の能力を高めようとしているため、これは意義深い。

ディープマインドはグーグルの親会社アルファベットの下でほとんど自由に開発している。もっとも、この技術は実際の製品に組み込まれる予定だ。

ディープマインドのデビッド・シルバー氏は17日に投稿したブログで、「われわれは訓練スピードを桁違いに速めるために、グーグルのクラウドを活用した大規模分散型の深層強化学習システム『ゴリラ』も構築した。これはグーグルのレコメンドシステムに応用されている」と述べた。

強化学習は試行錯誤を通じて学習する手法だ。ディープマインドはこの手法と、人工ニューラルネットワークを大量のデータで訓練した上で、新たなデータを推測させる「深層学習」とを組み合わせている。

■次のAIも研究中

シルバー氏は17日のブログで、ディープマインドの最新の研究の一端について明かした。

「われわれはロボットの操作や運動など連続制御の課題向けに多くの深層学習を強化するメソッドも開発している。(たとえば)決定性方策勾配アルゴリズム(DPG)はディープマインドが開発したAIアルゴリズム『DQN(ディープQネットワーク)』に連続アナログを提供し、Qネットワークの微分可能性を使って様々な連続制御タスクを解決する。非同期式の強化学習もこうした分野で優れた成果を上げており、階層制御戦略で補えば、その力学についての予備知識がなくても3Dサッカーや54次元の人型ロボットによるスラロームといった難しい課題を解決できる」と話した。

シルバー氏は、ディープマインドが数カ月以内にオープンソースのソフトウエア「ラビリンス」をリリースすることも明らかにしている。

By Jordan Novet

(最新テクノロジーを扱う米国のオンラインメディア「ベンチャービート」から転載)

日経電子版が2月末まで無料!いつでもキャンセルOK!
お申し込みは1/31まで

保存
共有
印刷
その他

電子版トップ



[PR]

日本経済新聞社の関連サイト

日経IDの関連サイト

日本経済新聞 関連情報