2019年8月24日(土)

プレスリリース

東芝デジタルソリューションズ、特許庁から受注した機械翻訳システムが稼動開始-中日翻訳・韓日翻訳機能を開発へ

2019/5/31 17:35
保存
共有
印刷
その他

発表日:2019年5月31日

特許庁から受注した機械翻訳システムの稼動開始について

~NICTが開発した最新のニューラル機械翻訳エンジンの採用により、正確で自然な翻訳を実現~

東芝デジタルソリューションズ株式会社(以下、当社)が2018年4月に特許庁から受注した「機械翻訳システム」の日英翻訳機能が、当初の計画通り、5月から特許庁にて稼動開始しました。今後は、中日翻訳機能・韓日翻訳機能のリリース(2020年4月予定)に向けて、開発を進めていきます。

特許戦略のグローバル化に伴い、特許文献を翻訳する頻度・件数は急増しています。しかし、従来の人手による翻訳作業では、時間がかかる、コストが高い、大量の翻訳が難しいなどの課題がありました。これらの課題を解決する手段として、機械翻訳の活用が進んでいますが、従来のルールベース機械翻訳エンジン(注1)(RBMT)や統計的機械翻訳エンジン(注2)(SMT)では、正確さや自然さに欠けるなどの問題がありました。近年になり、人工知能(AI)を活用したニューラル機械翻訳エンジン(注3)(NMT)の登場で、翻訳品質は格段に向上しましたが、原文のパターンによっては誤訳(訳抜け、湧き出し(注4)等)が生じやすいなどの欠点が指摘されています。

また特許文献は、内容が長文で記載される明細書部分・請求項部分と、句から構成される「発明の名称」「出願番号」「出願人」の定型部分が同一文書内に含まれ、明細書部分・請求項部分にはNMTが適している一方、定型部分はRBMTやSMTが適するなど翻訳エンジンの向き・不向きが混在しているという課題がありました。

今回稼動開始した「機械翻訳システム」は、当社が長年培ってきた自然言語処理技術に、国立研究開発法人情報通信研究機構(以下、NICT)先進的音声翻訳研究開発推進センターが開発した最新のNMTを組み合わせることにより、従来の機械翻訳では難しかった正確で自然な機械翻訳を提供しています。当社の自然言語処理技術で、特許文献の明細書部分・請求項部分や定型部分を自動で切り分け、NMT、RBMT、SMTに適宜振り分けます。加えて、NMTの弱点とされる誤訳が生じにくいように入力文を整形する処理技術を実装します。これらにより、NMTの翻訳性能を最大限に活かした翻訳を実現しました。さらに、日本マイクロソフト株式会社(以下、マイクロソフト)のクラウドプラットフォームMicrosoft Azureを採用することで大量の特許文献に対して高速の翻訳処理を可能にしました。

当社は今後も、NICTおよびマイクロソフトと連携し、高品質の機械翻訳ソリューションの開発・改良を続け、グローバル化の進展に伴い高まる、企業、研究機関・官公庁の翻訳ニーズに応えるソリューションを提供していきます。

※以下は添付リリースを参照

リリース本文中の「関連資料」は、こちらのURLからご覧ください。

添付リリース

https://release.nikkei.co.jp/attach_file/0511071_01.pdf

保存
共有
印刷
その他

電子版トップ速報トップ



[PR]

日本経済新聞社の関連サイト

日経IDの関連サイト

日本経済新聞 関連情報

新しい日経電子版のお知らせ

より使いやすく、よりビジュアルに!日経電子版はデザインやページ構成を全面的に見直します。まず新たなトップページをご覧いただけます。

※もとの電子版にもすぐ戻れます。