/

ワードにAI 視覚障害者向け写真説明を自動生成

VentureBeat

米マイクロソフト(MS)は2017年早々に「ワード」と「パワーポイント」で写真の説明を自動生成し、文書に加えられるようになると発表した。まず業務ソフト「オフィス365」の利用者がウィンドウズパソコンでこのサービスを使えるようになる。

「代替テキスト」がないと、視覚障害者は写真の内容が分からない

本来はパワーポイントに写真を埋め込む際、写真のタイトルと説明を「代替テキスト」(編集部注:画像が見えない場合のために入れる画像の内容を表した文章のこと。画像の下などに添えるキャプションとは別)で入力できる。だが、スライドの作成時に誰もがこれを行うわけではない。このため、視覚障害者はスライドを開いても写真の内容が分からず、そのスライドや資料全体を十分に理解できない恐れがある。

MSはこの状況を変えるため「コグニティブ(認知)サービス」の「コンピュータービジョンAPI」を活用し、写真の代替テキストの生成プロセスを自動化することにした。同社のオフィスエンジニアリングチームでアクセシビリティ(使いやすさ)担当リーダーを務めるジョン・ジャンドルザック氏は、ブログへの投稿で「このサービスは機械学習によって自ら改良を重ね、メディアを駆使した分かりやすいプレゼンテーションの作成時間を大幅に短縮してくれる」と強調した。この機能を使うには、写真を右クリックして「自動代替テキスト」を選べばよい。

この技術ではディープラーニング(深層学習)という人工知能(AI)の一種を活用して写真の中の物体を認識し、その写真全体を説明する最適な表現を見つけ出す。これをウィンドウズのスクリーンリーダーが読み上げる。

ディープラーニングでは、写真など大量のデータで人工のニューラルネットワークを訓練した上で、新たなデータについて類推させるのが一般的だ。マイクロソフトに加え、アップルやフェイスブック、グーグル、ツイッターもこの手法を使っている。

フェイスブックも似たサービスを導入

実際、フェイスブックは今年に入り、今回のマイクロソフトとよく似たサービスを開始。利用者がシェア(共有)した写真の説明を自動生成する仕組みを導入した。視覚障害者が米アップルの「iOS」搭載端末でフェイスブックのニュースフィードをスクロールすると、iOSの画面読み上げ機能「ボイスオーバー」がすぐに自動生成されたキャプションを読んでくれる。これにより、視覚障害者は他の利用者が投稿した写真の内容やコメントを理解できるようになった。

ツイッターは最近、利用者が投稿した画像に手動で説明を付けられるようにした。同社もディープラーニングの研究に取り組んではいるが、画像のキャプションを自動生成する機能は提供していない。

ジャンドルザック氏はブログへの投稿で、現在は分かれているタイトルと説明のフィールドをまとめる方針も明らかにした。この方法では「代替テキストをどこに入力するのか迷わなくなる」という。現在は、画像に説明を加えるには「(図の)書式設定」作業ウィンドウを開いて「サイズとプロパティ」(パワーポイントの場合。ワードでは「レイアウトとプロパティ」)タブを選択し、さらに「代替テキスト」を選ばなくてはならない。

By Jordan Novet

(最新テクノロジーを扱う米国のオンラインメディア「ベンチャービート」から転載)

すべての記事が読み放題
有料会員が初回1カ月無料

セレクション

トレンドウオッチ

新着

注目

ビジネス

ライフスタイル

新着

注目

ビジネス

ライフスタイル

新着

注目

ビジネス

ライフスタイル

フォローする
有料会員の方のみご利用になれます。気になる連載・コラム・キーワードをフォローすると、「Myニュース」でまとめよみができます。
新規会員登録ログイン
記事を保存する
有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン
Think! の投稿を読む
記事と併せて、エキスパート(専門家)のひとこと解説や分析を読むことができます。会員の方のみご利用になれます。
新規会員登録 (無料)ログイン
図表を保存する
有料会員の方のみご利用になれます。保存した図表はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン