AI

フォローする

Myニュース

有料会員の方のみご利用になれます。
気になる連載・コラムをフォローすれば、
「Myニュース」でまとめよみができます。

「ミッションはAIの民主化」 グーグル研究者
グーグルに学ぶディープラーニング(下)

(1/2ページ)
2017/2/20 6:30
共有
保存
印刷
その他

日経ビッグデータ

 今、テクノロジー業界では、空前のディープラーニングブームが起きている。しかし、米グーグルのクラウド・マシンラーニング・グループ研究責任者であるジア・リー氏は、「アルゴリズムが人間に勝っていると考えるのはまだ早い」と冷静に見る。「人間ならば、1枚の写真があるだけでも新しい物を認識する学習ができるが、ディープラーニングではそんなこともできない」と指摘する。

──画像認識はこの数年で急速に精度が高まり、応用範囲が広がっている。何が技術革新を牽引したのか。

グーグルクラウド・マシンラーニング・グループ研究責任者のジア・リー氏。米スタンフォード大学でコンピューターサイエンスの博士号を取得後、ヤフー・ラボや、若者中心に人気の動画メッセージングサービスのスナップチャットで人工知能、機械学習、画像認識などの研究を行い、2016年にグーグルで機械学習グループの研究責任者に着任
画像の拡大

グーグルクラウド・マシンラーニング・グループ研究責任者のジア・リー氏。米スタンフォード大学でコンピューターサイエンスの博士号を取得後、ヤフー・ラボや、若者中心に人気の動画メッセージングサービスのスナップチャットで人工知能、機械学習、画像認識などの研究を行い、2016年にグーグルで機械学習グループの研究責任者に着任

 コンピューターサイエンスにとって画像認識は、長年にわたって克服すべき課題だったが、この数年で大きな進歩を遂げてきた。それには、3つの要因があったと考えている。「ビッグデータ」「コンピューターの性能向上」「先進的なアルゴリズム」だ。

 インターネットの発達は、大量の画像データの入手を容易にしている。CPUを大量に用意したり、高速な演算が可能なGPU(グラフィック・プロセッシング・ユニット:画像処理半導体)を利用したりすることで、コンピューターの性能も向上した。その上で、先進的なアルゴリズムであるディープラーニングがこれらのファクターを統合して、画像認識を高精度に行えるようにしたのだ。ディープラーニングが、画像認識の精度向上の一番の牽引力になっている。

──実際にディープラーニングによって、人間を超える画像認識の精度が得られたという成果が発表されている。

 そうだ。最新のディープラーニングによる画像認識のアルゴリズムと、スタンフォード大学の博士課程の学生による、画像を認識して分類する比較実験では、アルゴリズムが人間に勝っているという結果が得られている。画像認識の研究が大きく進歩したことを意味していると思う。

 しかし、これをもって「画像認識ではアルゴリズムが人間に勝っている」と考えるのはまだ早い。先駆的な研究を続けてきたことで、画像認識の特定の分野では人間よりも高い精度が得られるようになったが、これは画像認識のごく一部でしかない。まだ解明していかなければならない問題は数多くあり、改善、発展の余地はたくさんある。

■アルゴリズムの研究はまだまだ途上

──画像認識のどのような部分が、アルゴリズムではまだ実現できていないのか。

 例えば、画像を総合的に理解することや、逆にイメージを分割して理解すること、さらにアクションやイベントを解明して理解するといったことだ。総合的に理解するというのは、イメージの中にさまざまな情報が含まれているときに、どういった物体が映っていて、それがどのようなイメージなのかを理解することだ。例えば、そのイメージのキャプション(説明文)を付けるという課題は、総合的で高次のイメージの理解が必要になる。

 一方で、イメージを分割して理解することも難しい課題だ。イメージの中のピクセルが、椅子なのか机なのか、人間の髪の毛なのかを認識して物体を同定し、その境界線がどこにあるのかを探すといったような課題だ。ビデオの中で物体の軌道や軌跡を認識する課題もある。

──まだ、ディープラーニングよりも人間が優れている分野もあるということか。

 もちろんだ。「イメージネット」(http://image-net.org/)という画像認識の1つのデータセットを使った研究では、画像分類で人間に勝っているという成果が得られたが、人間のほうがずっと優れている課題がたくさん存在している。研究者は、研究を続けなければならない。

 人間は、膨大な知識を使って、文脈(コンテキスト)を把握した上で画像を認識できる。ひと目で状況を判断する「百聞は一見にしかず」といった部分だ。コンピューターでも、知識を裏付けとして画像をコンテキストと結びつける研究は進められているし、イメージを記述できるようにはなってきているが、人間のような高度な認識はまだできていないのが現状だ。

 動画は、静止画よりも画像を理解するための追加的な情報を利用しやすい性質がある。時系列の連続した画像があり、オーディオのデータもある。人間はそれらを総合的に判断して理解するが、コンピューターではそれらから得られた信号を統合させて活用する研究がまだまだ必要なのだ。

  • 前へ
  • 1ページ
  • 2ページ
  • 次へ
共有
保存
印刷
その他

電子版トップテクノロジートップ

日経BPの関連記事

【PR】

AI 一覧

フォローする

Myニュース

有料会員の方のみご利用になれます。
気になる連載・コラムをフォローすれば、
「Myニュース」でまとめよみができます。

眼鏡店「JINS」東京駅八重洲店の店内。(東京都千代田区)

似合うメガネAIが目利き ジンズ、機械判定で売上増 [有料会員限定]

 「ウエリントンタイプのJINSクラシック コンビネーション:マッチ度87%」――。ユーザーがオンライン上で選んだメガネの“お似合い度”を判定するサービス「JINS BRAIN」を、大手メガネチェーン…続き (5/10)

音声認識、アマゾン対抗馬はAIで運転車の好み学習 [有料会員限定]

 次世代のユーザーインターフェース(UI)技術の一つとして重要視される音声認識。米Amazon.com(アマゾン・ドット・コム)の音声認識・対話機能基盤「Alexa」の台頭が目立ち始めた。迎え撃つ格好…続き (4/28)

コールセンターの応対業務でAIを活用し、保留時間を10%削減した

AIで電話保留時間1割減、顧客の感情も推定へ [有料会員限定]

 顧客接点として、コールセンターの重要性が高まっている。契約後の問い合わせやクレームにきめ細かく対応してこそ、顧客のロイヤルティが高まる。だが人手不足が厳しい折、熟練のオペレーターを十分に確保するのは…続き (4/26)

新着記事一覧

最近の記事

【PR】

日経産業新聞 ピックアップ2017年5月25日付

2017年5月25日付

・キヤノン、ドローンに産業用カメラ 夜間でも災害監視
・穴あき繊維でおむつ柔らか 三井化学
・サントリー 海外でも森林保全 米ビーム拠点の周辺で
・アマダHD、成長市場に的、UAEなど3カ国に新拠点
・赤帽、運転手の技能生かす サービスの質向上…続き

日経産業新聞 購読のお申し込み
日経産業新聞 mobile

[PR]

関連媒体サイト