2019年7月19日(金)

東芝の音声合成アプリ、3万DL 自分の声、「分身」手軽に
戦略ネットBiz

コラム(ビジネス)
2018/11/28付
保存
共有
印刷
その他

NIKKEI MJ

東芝の音声合成アプリが配信開始から半年足らずで3万件のダウンロードを突破した。複数の例文を読み上げるだけで、話し方の特徴などを分析してその人の声を合成する。SNS(交流サイト)などで送信したメッセージを自分の声で読み上げて楽しめるうえ、今後は合成した声をゲームや音声広告で活用することも検討している。

東芝は音声技術を活用し、利用者の声を合成するアプリを展開する

東芝は音声技術を活用し、利用者の声を合成するアプリを展開する

「1人分は350ドルとなります」。スマートフォン(スマホ)に表示される例文を読み上げていくと、声の明るさや流ちょうさ、語尾の抑揚など人それぞれの声の特徴を分析。自分の声の「分身」を合成するのが東芝のアプリ「コエステーション」だ。

10の例文を読み上げるだけで、自分の声が合成される。アプリで「読み上げ」を選ぶと合成した声に好きな文章を読ませることができ、「育てる」ではさらに多くの例文を読み上げる。最大は200文で、読み上げた文の数に応じて合成される声の精度が上がっていく。

最初はたどたどしい合成音声でも、徐々に本当に話しているかのような声になっていく。ユーザーは自分が投稿するSNSへのコメントなどを合成した声に読ませることもできる。さらにゲームに自分の声を登場させたり、人工知能(AI)スピーカーの読み上げ音声を子供や孫の声にしたりできる。難病などで声を失ってしまう人が事前にコエステーションで自分の声を合成するといった事例も出ているという。

東芝が持つAI技術と音声合成技術を活用した。実は東芝は40年以上前から音声合成の研究をしており、カーナビゲーションシステムや駅構内のアナウンスで高いシェアを誇る。ナレーターの録音では対応が難しい地名や駅名の音声合成に使われており、この技術を一般利用者の音声合成にも転用した。

東芝デジタルソリューションズの金子祐紀コエステーション事業推進プロジェクトリーダーは「声のデータベースを作る」と意気込む。アプリなどを通じて一般利用者から有名人まで幅広い「声データ」を収集し、自分の声を利用してもらったり好きな声を使ったりする仕組みを作る取り組みだ。

例えばカーナビやオーディオブック。自分の好きな有名人やアイドルの声で道案内や文章の読み上げに利用することに対価を払う。東芝の技術を使えば、本人さながらの声が使えるため本当に膨大な文章を読まずともオーディオブックが完成する効率性もあるという。

音声認識・合成技術は2025年に市場規模が2000億ドル規模になるとの予測もある。東芝の音声合成技術では単なる読み上げだけでなく喜びや悲しみ、切迫感なども表現できる。こうした技術的な利点に加えて、データベースを構築することで他社との差異化を図りたい考えだ。

もっとも、合成音声の悪用・防犯対策も欠かせない。オレオレ詐欺への悪用のほか、テレビや動画投稿サイトを通じて声が盗まれるといったことも想定される。東芝は音声を合成する際に自ら読み上げないとなかなか使わない例文を用意。勝手に音声が合成されるリスクを未然に防ぐ。

今後はAIスピーカーやスマホの音声アシスト機能の普及により、これまでラジオがほとんどだった音声広告市場が拡大することも見込まれる。デジタル化やあらゆるモノがネットでつながるIoT化の進行に伴い、音声合成が活躍する場が広がりそうだ。

(志賀優一)

[日経MJ2018年11月28日付]

「日経MJ」をお手元のデバイスで!

 日経MJではヒット商品の「売れる」理由を徹底リサーチ。売り場戦略から買い手の最新動向まで、独自に取材。「日経MJビューアー」を使えば、全てのデバイスで閲覧できるようになります。

保存
共有
印刷
その他

関連企業・業界 日経会社情報DIGITAL

電子版トップ



[PR]

新しい日経電子版のお知らせ

より使いやすく、よりビジュアルに!日経電子版はデザインやページ構成を全面的に見直します。まず新たなトップページをご覧いただけます。

※もとの電子版にもすぐ戻れます。