/

NTT、声の特徴に基づき"聞きたい人の声"を抽出する技術を実現

企業:NTT

発表日:2018年5月31日

世界初、声の特徴に基づき"聞きたい人の声"を抽出する技術を実現

~深層学習の新技術により、騒がしい環境で特定の声のみを抽出可能に~

日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:鵜浦博夫、以下NTT)は、複数の人の声が混ざった音声から、目的話者の声の特徴に基づき、その人の声だけを選択的に抽出する技術SpeakerBeam(※1)を実現しました。

本技術は、様々な声や雑音が聞こえている環境において、目的話者の声の特徴やその位置だけに注目して、その声を聞き取る人間の聴覚の能力「選択的聴取(※2)(図1参照)」と同等の機能を実現したことに相当します。選択的聴取のうち、話者の位置に注目して声を聞き取る能力(※3)は、すでにコンピュータでも実現されていましたが、目的話者の声の特徴に注目して聞き取る能力は、本技術が世界初です。今回、NTTが独自開発した深層学習(※4)の新技術を用いて、この実現に成功しました。

本技術を用いることで、目的話者がどこで話すかわからない状況などでも、その声の特徴に注目して音声を抽出することができます。今後、人の会話を理解する音声認識・ロボット技術などに、本技術を応用していく予定です。

【背景】

近年、コンピュータによる自動音声認識技術が急速に発展し、スマートホンやスマートスピーカなどの音声インタフェースで利用されるようになってきました。しかし、日常の様々な場面では、複数の人が会話をしていたり、テレビの音声が背景で流れていたりするなど、目的話者以外の声が混ざって収録されることが、しばしば起きます。現在の音声認識技術では、目的話者だけに注目してその声を聞き取ること(選択的聴取)ができないため、このような状況にうまく対応することができませんでした。

*以下は添付リリースを参照

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

添付リリース

http://release.nikkei.co.jp/attach_file/0480863_01.pdf

すべての記事が読み放題
有料会員が初回1カ月無料

関連企業・業界

企業:

関連キーワード

産業で絞り込む
  • すべて
  • 情報・通信
  • メディア
  • 電機
  • 金融・保険
  • 自動車
  • 輸送・レジャー
  • 食品
  • 流通・外食
  • 日用品
  • 医薬・医療
  • 建設・不動産
  • 機械
  • 素材・エネルギー
  • 商社・サービス
  • すべて
  • 情報・通信
  • メディア
  • 電機
  • 金融・保険
  • 自動車
  • 輸送・レジャー
  • 食品
  • 流通・外食
  • 日用品
  • 医薬・医療
  • 建設・不動産
  • 機械
  • 素材・エネルギー
  • 商社・サービス

セレクション

トレンドウオッチ

新着

注目

ビジネス

暮らし

新着

注目

ビジネス

暮らし

新着

注目

ビジネス

暮らし

フォローする
有料会員の方のみご利用になれます。気になる連載・コラム・キーワードをフォローすると、「Myニュース」でまとめよみができます。
新規会員登録ログイン
記事を保存する
有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン
Think! の投稿を読む
記事と併せて、エキスパート(専門家)のひとこと解説や分析を読むことができます。会員の方のみご利用になれます。
新規会員登録 (無料)ログイン