通訳がいるかのように外国語話者と通話し、指を使ったタッチ操作無しに情報を検索――。機械が人間の話した内容を解析する音声認識技術が、スマートフォン(高機能携帯電話=スマホ)で花開こうとしている。文字情報への変換性能の進歩に加え、端末の処理能力や通信の質も向上。数年のうちに、話しかけるように入力や操作をするのが当たり前にできる時代が訪れそう。2012年は米アップルがiPhone4Sに取り入れた音声操作機能「Siri」の日本語対応も見込まれ、通訳機能などを軸に開発を進める日本勢の技術も含め話題を集めそうだ。
「お土産を探しています。何かお勧めのものはありませんか」。通話時と同様にスマホの端末を耳につけて話すこと数秒、中国語に訳された音声が返ってきた。情報通信研究機構(NICT)がiPhoneやアンドロイド端末向けに配信している「VoiceTra」は、音声で入力した言葉を別の言語に翻訳して発音してくれるアプリ。日英中韓の4言語とインドネシア語、ベトナム語が音声認識、発音に対応しているほか、この6言語を含む21の国や地域の言語(ブラジルで使われているポルトガル語や台湾華語も含む)に文字で翻訳することが可能だ。
このアプリ、実際の翻訳処理はスマホが行っているわけではない。端末で収録した音声データをNICTのサーバーに送り、音声解析や翻訳、音声合成を経て、翻訳後の音声データを再び端末に戻している。通話用に音声入出力ができ、データ通信もできるスマホが実用化されたからこそ、実現した仕組みだ。「3G(第3世代携帯電話)から4Gへの移行、Wi―Fiの普及など通信環境も向上している」(多言語翻訳研究室の隅田英一郎室長)ことも追い風になっている。
NICTの前身組織が音声認識の研究に着手したのは約25年前。単語を一語一語とらえる段階から、アナウンサーが丁寧に話せば認識できるようなレベルを経て、会話文を認識できるレベルまで少しずつ技術を高めてきた。15年ほど前に集めた日本全国4000人分の音声データを活用。これをもとに単語や語順が日本語として適切であろう確率を算出し、それが最も高くなるよう翻訳文を構築する仕組みも実現した。
アップル、iPhone、NICT、Siri、オムロンソフトウェア、富士通研究所、NTTドコモ、富士通
東日本大震災の災禍を目の当たりにして、21世紀のテクノロジーの最前線に立つ多くの科学者や技術者が無力感にさいなまれた。2012年はそこから立ち直り、再び英知を結集して自然の猛威に備える節目の年になる…続き (1/5)
通訳がいるかのように外国語話者と通話し、指を使ったタッチ操作無しに情報を検索――。機械が人間の話した内容を解析する音声認識技術が、スマート…続き (1/3)
次世代スマホ、処理量に応じ賢くCPU使い分け (5/25)
ホンダジェットを生み出す独創拠点「R&Dセンター」 (5/23)
福島で「消費者から信頼されるコメ」を (5/23)
NEC、バッテリー内蔵型のデスクトップ節電PCを発売 (5/24)
電力不足下の節電、調達技術の活用で企業を支援 (5/22)
気候変動への適応策、急務 農業・衛生など影響 (5/23)
2012年5月25日付 (5/24)
2国間の安全保障問題を乗り越える 中国華為が米で攻勢 (5/24)
海洋・地熱エネルギー、古くて新しい電源 (5/24)
ヒトゲノム1000ドル革命 解読1日で (5/23)
各種サービスの説明をご覧ください。
・名門ハザマ、10年目の白旗
・「すみだ産」世界に挑む、ものづくり現場発~東京・墨田を行く
・スマホ向け定額音楽配信、聞き放題で利用者拡大
・ヤマハ発が200万人試乗会、インドネシアで二輪販促策
・カジタク、家事代行、大阪・仙台でも…続き