2019年2月23日(土)

音声AIで一変する消費行動

2017/6/2 6:30
保存
共有
印刷
その他

VentureBeat

米アマゾン・ドット・コムの会話型AI(人工知能)「アレクサ」や米グーグルのスマートスピーカー「グーグルホーム」などに搭載されている音声AI技術は、IT(情報技術)企業の次のフロンティアだ。米フェイスブックが先日、会話型AIの開発プラットフォーム「ParlAI(パーレイ)」の立ち上げを発表したことで、コンピューターと音声で有意義な会話をする最終目標の達成に向けたIT業界の士気はさらに高まった。だが、冷静になって考えると、まだそこには至っていない。

筆者の会社(デジタルコンテンツ制作会社のメディアモンクス)では、この新たなテクノロジーを開拓したいと考えるブランド各社からの依頼が増えている。当社もエンジニアやプロダクトチームと協力し、このテクノロジーの能力を正確に理解しようと取り組んでいる。現時点では、音声AI技術にはさらなる飛躍が必要だが、スマートになりつつあり、手っ取り早いのは確かだ。

筆者は最近、世界有数の消費財メーカーのトップからこんな話を聞いた。そのトップは自社のライバル製品のテレビCMを見たのをきっかけに、アレクサを試してみようと考えた。その製品カテゴリーでどのブランドが一番良いかと尋ねると、アレクサは様々な企業の名を挙げてすぐに答えてくれた。後日、その中の1社からサンプル送付の申し出があり、別の会社からは最安値を提示されたという。この話は、音声AI技術はまだ有意義な会話はできなくても、進歩しつつあり、各社がこれを生かす機会も増えていることを示している。

■現時点での長所と短所、今後の有望性

米国の音声アシスタント市場は2016年以降で130%近く成長していることが最近の研究で明らかになった。

アマゾンのスマートスピーカー「エコー」

アマゾンのスマートスピーカー「エコー」

現時点では、アマゾンのスマートスピーカー「エコー(アレクサ)」とグーグルの「グーグルホーム」が市場を支配している。この2つは独立した据え置き型端末という点で、米アップルの音声アシスタント「Siri(シリ)」や「Google Now(グーグルナウ)」とは一線を画す。音楽を呼び出したり、スケジュールを教えてくれたり、ささいな質問にまで答えてくれることで、「自宅をよりスマートにする」のが主な機能だ。

音声AI技術の最大のメリットの一つは、時間がかからない点だ。話しかける方が書くよりも自然で、スマートフォン(スマホ)を取り出す必要もないので手っ取り早い。しかも、様々な理由でキーボードや画面を使えない人にとってもアクセスしやすい。インターコムのプロダクトマネジャー、ヒュー・ダーキン氏のような熱狂的なファンは「近いうちに、無用なキーボード入力やタップは遠い過去の記憶になる」と褒めちぎるほどだ。

おそらくその通りだろう。とはいえ、この機能にはまだ至らぬ点もある。多くの人が同時に端末の近くで話していると、合言葉を聞き取れないことが多い。リクエストを何度も繰り返すくらいなら、歩いて行ってスイッチを入れる方が早い場合もある。

プライバシーの問題も考慮しなくてはならない。米ハンバーガーチェーン大手「バーガーキング」の最近のテレビCMはその最たる例だ。このCMではグーグルホームを起動させる合言葉「OK、グーグル」を逆手に取り、(テレビの音声に反応した各家庭の)端末に同社のハンバーガー「ワッパー」の特徴を(オンライン百科事典「ウィキペディア」の情報を読み上げることで)説明させた。ところが、CMの放送開始から数時間以内に、CMは放送中止となり、ウィキペディアのワッパーのページには面白おかしい編集が相次いだ。このCMに広く反応したことで、音声AIは多くの人にとってまだ不慣れだという事実や、人やモノに会話を盗み聞きされるのは不快だという考え方が浮き彫りになった。

とはいえ、これらは技術的な問題にすぎない。最大の課題はコンピューターが翻訳や音声認識、音声合成能力を上達できるプロセスをつくり出したのに、大半のコンピューターがいまだに言葉の意味を理解できない点にある。フェイスブックのマーク・ザッカーバーグ最高経営責任者(CEO)は「会話を理解できる優秀なAIシステムはまだ存在しない。現在のシステムは発言を聴くことと、次にどんな発言をするかを予測することの両方に頼っている。構造的なスピーチの方が非構造的な会話よりもまだずっと理解しやすい」と述べている。しかも、一般消費者は日常生活に音声AIをとり入れる価値を見いだしていないことが調査で明らかになっている。

■今から将来への備えを

音声AIにはまだ制約が多い。それでも、機械学習の進化に伴い、コンピューターは人の話を認識できるようになりつつある。まだそこまでには至っていないものの、ザッカーバーグ氏が掲げる「会話を理解するAI」という目標は、はるかに遠くでもないかもしれない。

11年の世界の音声認識市場の規模は470億ドル弱だった。あれから6年で、市場規模は1130億ドルと倍以上に拡大した。フェイスブックが今回発表した投資以外にも、音声認識から自然言語処理への大規模なシフトが加速している。これが達成されれば、コンピューターにもっと洗練した会話をさせたいというザッカーバーグ氏の願いはかなうだろう。

ブランド各社は今すぐにこの新たなフロンティアに備えるべきだ。前述のアレクサの例が示すように、オプションの比較や購入の際、こうした端末を頼りにする消費者はすぐに増えるようになる。各社は今のうちにこの変化を見据え、自社の電子商取引やマーケティング戦略をこうした端末に連携させておかなくてはならない。ネットショッピングが実店舗での体験を一変させたように、音声AI技術は消費行動を次の段階に引き上げるだろう。

人間とコンピューターのやり取りから生じる有意義な会話と、結果重視の解決策への期待は日を追うごとに高まっている。こうしたテクノロジーの開拓と貢献に引き続き一丸となって取り組もう。音声AIがさらにスマートになり、言葉を交わすごとに有意義になりつつあるのだから。

By S. Jason Prohaska(オランダのデジタルコンテンツ制作会社メディアモンクスのマネージングディレクター)

(最新テクノロジーを扱う米国のオンラインメディア「ベンチャービート」から転載)

保存
共有
印刷
その他

電子版トップ



[PR]

日本経済新聞社の関連サイト

日経IDの関連サイト

日本経済新聞 関連情報