2018年8月16日(木)

異なる言語間の対話仲介 人工知能で「同時通訳」手元に
宮本和明 米ベンチャークレフ代表

(2/3ページ)
2015/5/11 6:30
保存
共有
印刷
その他

 使い始めた当初は音声認識の精度が悪く、翻訳が会話の途中から始まったりして、かなり戸惑った。しかし、パソコン内蔵マイクの代わりにヘッドセットを使うと、音声認識の精度が大幅に改善された(後で説明を読むとヘッドセットを使うよう書いてあった)。また、少し早口に話すと、会話の途中で翻訳が始まらず、発言が終わった時点で開始されるため、スムーズに会話できることが分かった。

 Skype Translatorに慣れるまでには少し時間がかかったが、その後は相手の言っていることが理解できるようになった。現時点ではMicrosoftがベータ版としているように、システムは実戦を通して学習中だが、「意外と使える」との印象を持った。

■翻訳のプロセス

 Skype Translatorは人工知能をフルに活用している。音声認識と機械翻訳機能を搭載し、それらを機械学習プラットフォーム上に展開している(下写真)。

出典: Microsoft

出典: Microsoft

 動作の仕組みはこうだ。利用者が発言すると、Skype Translatorがそれをテキストに変換(Speech Recognition、音声認識)する。システムは変換されたテキストから、「あー」とか「うー」など翻訳に障害となる言葉(Speech Disfluency)を取り除く。この処理が施されたテキストを相手の言語に翻訳(Machine Translation、機械翻訳)し、それを音声に変換(Speech Synthesis、音声合成)することで一連のプロセスが完結する。

 音声認識のプロセスに人工知能を適用することで、認識率が格段に向上した。システムは機械学習で入力した教育データから、会話に関する言葉の統計モデルを構築する。利用者が言葉を発すると、それを統計モデルと比較して、類似のケースを見つける。具体的には、発言者の音声を細分化し、音声要素(Senoneと呼ぶ、Phoneme=音素よりさらに細かい単位)で定義する。これを事前に学習したデータと比較し、最も出現確度が高いテキストに変換する。

 音声認識では、学習教材から言語に関することを学び、精度を上げることが重要になる。教育データとして、翻訳されたWebページ、ビデオのキャプション、1対1の会話の翻訳などが使われている。ただし、Skype Translatorはまだまだ教育中で、ベータ版を利用している人の会話を保存し、教育データとして使っている。このため、Microsoftは利用上の注意として、「製品改良のために利用者の会話が保存される」ことを明示している。

■Deep Neural Networksを適用

 Skype Translatorは、音声認識で「Deep Neural Networks(DNNs)」を使っている。これによって認識率が格段に向上し、音声認識技術のブレークスルーになったと言われている。

 具体的には、従来の手法(Gaussian Mixture Model)に比べて、難しいタスクのベンチマークで、エラー率が33%も減少した。Microsoft ResearchのFrank Seide氏らは、これを「Conversational Speech Transcription Using Context-Dependent Deep Neural Networks」と題した学術論文で公表している。

 Microsoftの機械翻訳に関する研究は、カナダ・トロント大学のGeoffrey Hinton教授との出会いが成功への決定的なきっかけとなった。Hinton教授はDNNsを機械学習に応用し、「Fast Learning Algorithm for Deep Belief Nets」など歴史に残る論文を発表した。

 Microsoftは2009年12月、カナダでワークショップを開催し、その場でHinton教授がDNNsについて講演した。これが、Microsoftが音声認識技術にDNNsを採用することを導いた。

 発表内容は公開されているので、今でも読むことができる(下写真)。

出典: Microsoft

出典: Microsoft

■出発点は軍の暗号解析

 Skype Translator登場の背景には、音声認識や機械翻訳技術に関する10年を超える基礎研究の歴史がある。

 そもそも機械翻訳技術の開発は、第二次世界大戦をきっかけに始まった。英国諜報機関がドイツ軍の暗号解読に成功したことで、言語を他の言語に変換することへの期待が高まった。暗号解析では“人工知能の生みの親”とされるAlan Turing(アラン・チューリング)氏の功績が大きい。

  • 前へ
  • 1
  • 2
  • 3
  • 次へ
保存
共有
印刷
その他

日経BPの関連記事

関連企業・業界 日経会社情報DIGITAL

電子版トップ



[PR]

日本経済新聞社の関連サイト

日経IDの関連サイト

日本経済新聞 関連情報