AIで進化する翻訳サービス 「同時通訳」可能な時代に
先読みウェブワールド (藤村厚夫氏)

人工知能(AI)の世界で翻訳技術が急速に進展し、翻訳・通訳サービスを気軽に利用できる環境が整ってきた。この1年ほどの間に、スマートフォンのアプリやクラウド型のサービスが続々登場。利用料無料から、個人でも購入できるようなサービスまで選択肢が増えている。
- 【関連記事】
2016年に米グーグルがAIの一つである深層学習(ディープラーニング)を使った「ニューラル翻訳」をインターネット上で公開した。同時期に米マイクロソフトや情報通信研究機構(NICT)もニューラル翻訳を採用し、精度が向上してきた。
サービスとして有名なのは「グーグル翻訳」だろう。無料で使え、約60カ国語をサポートしている。ただ、筆者は翻訳の精度がやや不満。そこで最近使うようになったのが、ドイツのスタートアップによるAI翻訳サービス「DeepL(ディープエル)」だ。自然で破綻の少ない訳文を生成してくれることが多い。
今年に入って日本でも商用サービスが始まった。無料でも利用できるが、有料購読が原則だ。有料版なら文書をまるごと翻訳するなどの機能もある。グーグル翻訳も精度が向上しているので、使い比べてから購入の判断をしてもいいだろう。
アプリ版のグーグル翻訳はスマホならではの機能として、文章の音声入力と翻訳ができる。文字列のコピーから翻訳が始まるウェブ版に比べて流れが自然だ。人間による逐次通訳に近い「会話」機能もある。日本語で数センテンス話すと、それを追いかけて英語などに翻訳し、読み上げてもくれる。1台のスマホを間に置いて2人が会話を行うようなシーンが想定される。
音声入力はスマホの得意分野だ。聞き取り、翻訳という手間のかかる演算処理もクラウドに委ねることができるため、高機能なパソコンを用意する必要もない。グーグル翻訳はその一例だが、優れた聞き取り専用アプリも誕生している。

「Otter(オッター)」は英語の講演や講義など長尺の音声データを記録しながら、リアルタイムで英文を生成する。複数名が話しても発話者を識別したうえで記録できる。日本語化はDeepLなどに転送すればよい。
さて、ここまでくると欲しくなるのが「同時通訳」だ。できれば、同時通訳用レシーバーを耳にかけるぐらいの手軽さを求めたい。グーグルはこの8月に「ピクセル・バズ」という無線イヤホンを発売する。これは先のグーグル翻訳のリアルタイム翻訳機能と連携する。
もっと同時通訳レシーバー機能に特化した製品も登場している。「WT2プラス」がそれだ。マイクを装備したイヤホン2個がセットになった製品だ。1つを自分が、もう1つは相手が耳にかけて会話をすれば、双方向に通訳が行われる。「サイマル」モードを選択すれば、互いに区切りなく会話してもリアルタイムに通訳が続く。
音声翻訳の分野をリードする情通機構も、スマホで使え音声翻訳アプリを開発している。数年前であれば「未来」の生活シーンが、いまでは現実になろうとしているのだ。
[日経MJ2020年8月16日付]