2019年9月20日(金)

データの有無 勝負決める
SmartTimes (栄藤稔氏)

2018/1/29 6:30
保存
共有
印刷
その他

私はみらい翻訳という機械翻訳技術を開発する会社の社長を兼務している。機械翻訳は、コンピューター(機械)による自動翻訳のことだ。イマドキの言葉で表現すると、人工知能(AI)の1つである。

1985年松下電器産業(現パナソニック)入社。国際電気通信基礎技術研究所、NTTドコモのシリコンバレー拠点長や執行役員を経て2017年7月から大阪大学教授。みらい翻訳の社長を兼務。

1985年松下電器産業(現パナソニック)入社。国際電気通信基礎技術研究所、NTTドコモのシリコンバレー拠点長や執行役員を経て2017年7月から大阪大学教授。みらい翻訳の社長を兼務。

みらい翻訳の設立から約3年たったこの1月に深層学習(ディープラーニング)によるニューラル機械翻訳サービスの提供を開始した。深層学習を用いたAIは、人間の脳への類推から「ニューラル(神経)」という表現を用いる。

性能をわかりやすく示すため、英作文で人と競わせた。英語能力テスト「TOEIC」の受験経験のある人を数十人集め、日本語のビジネス文書を英語に翻訳してもらった。機械にも同じことをさせ、専門家が優劣を判定した。

機械翻訳の性能は、TOEICで900点の日本人の英作文能力を上回っていることがわかった。直訳だけの「なんちゃってAI」ではあるが、正確さと流ちょうさは並の翻訳家を上回るレベルに到達した。

2年前の旧バージョンの性能は655点で、就職活動中の大学生が履歴書に記入するか迷う水準だった。短期間に大きく改善したことがわかる。

ニューラル機械翻訳の原型は2014年に論文で発表された。筆者は計算量の多さと性能の不安定さから翻訳に利用されるのは数年先だと予測しつつ、強力なライバルが登場するのではないかと不安だった。不安は的中した。16年に米グーグルが実用化したニューラル機械翻訳の性能向上は衝撃的だった。そこで当社はニューラル機械翻訳の研究開発に集中した。結果は先に述べたとおりである。

07年に携帯電話向けの音声認識システムを開発したことが思い出される。それまでのシステムは10回話して数回間違うくらい認識率が低かった。それが100回話して数回間違う程度になれば実際に用いられる。

ボトルネックになっていた技術の性能が臨界点を超えたとき、不可能だと思われていたサービスが急激に立ち上がる。音声認識も画像認識も12年前後で臨界点を超えた。音声認識は様々な場面で利用されようとしている。画像認識も顔検索や自動運転を可能にした。データの集積と深層学習の進化が劇的変化をたった数年で起こしている。

「米国の巨大IT(情報技術)企業にAIの分野で勝てるのですか」という質問を受ける。答えをあえて単純化しよう。「データがあるところで勝ち、ないところで負ける」

みらい翻訳の機械翻訳はビジネス会話のデータがあることで救われた。さらなる改善には企業内のデータが必要だ。言い換えれば、データによって企業の諸活動を改善するデジタル変革が重要ということになる。

米国の巨大IT企業がデータを持ち得ない領域、例えば介護、医療、農業、製造、建設、漁業といった非IT分野でデジタル変革を進める。それがAIの技術と結びついて化学反応が起きる。デジタルを真剣に考えよう。明日は今日とは違う。

[日経産業新聞2018年1月26日付を再構成]

保存
共有
印刷
その他

電子版トップ



[PR]

日本経済新聞社の関連サイト

日経IDの関連サイト

日本経済新聞 関連情報

新しい日経電子版のお知らせ

より使いやすく、よりビジュアルに!日経電子版はデザインやページ構成を全面的に見直します。まず新たなトップページをご覧いただけます。

※もとの電子版にもすぐ戻れます。