AIに言葉の意味はわかるか 進化する自然言語処理
日経サイエンス
人工知能(AI)が人間のものと区別ができないほど巧みな文章を生成したり、コミュニケーションロボットが大きな支障なく会話を進めたりするのが当たり前になってきた。コンピューターで言葉を扱う自然言語処理技術がこの数年で急進展したためだ。言語というあいまいで揺らぎの大きい情報を機械が上手に扱えるようになってきた。自然言語処理の応用範囲も広がり、社会や産業のDX(デジタルトランスフォーメーション)のカギを握る技術になろうとしている。

自然言語処理AIを使った最新の言語モデルが生成する「人間が書いたような」文章が話題になっている。2020年10月、英語圏で人気の投稿サイト「Reddit」に登場したあるアカウントが毎日のように投稿し、他のユーザーとも会話を交わした。自殺未遂の経験があるユーザーに語りかけた情感あふれる投稿には、約150件の「いいね!」が付けられた。
だがこのアカウントはタスクをロボットのように自動でこなすソフトウエアであるボットだったことがやがて判明した。ボットが自動投稿に用いていたのは米AI研究機関が開発した「GPT-3」というAI言語モデルだった。
文章読解が得意なAI言語モデルも登場している。2018年10月にグーグルが発表した言語モデル「BERT」は、読解能力のベンチマークテストで人間の平均レベルをはるかに上回る結果をたたき出し「AIが読解力で人間を超えた」と注目された。このGPTやBERTといった言語モデルは、ディープラーニング(深層学習)をベースにしたトランスフォーマーというAI技術を使っている。
こうした機械学習AIによる自然言語処理と並んで、一時は下火になっていたAIに文法を教える手法にも新たな進展があり、機械学習と性能を競っている。お茶の水女子大学准教授の戸次大介らは有力な文法理論である「組み合わせ範疇(はんちゅう)文法」をベースにした、異なる文同士の含意関係を判定できるソフトウエアを開発。金融関係などビジネス文書や医療関連の文書の意味解析に使うことを試みている。
だがAIの言語理解は人間のそれではない。今のAIは単語や文書を多次元のベクトルで表現し、その相互の関係から言葉の意味の近さを推定している。「リンゴ」と聞いて、赤く甘酸っぱい果物を思い出しているわけではない。
こうした弱点を補うため、言葉が話されている状況や話者の身ぶりや表情などの情報を補うことでより文脈や状況に沿った言語理解を進めようという「マルチモーダル言語処理」が注目されている。情報通信研究機構(NICT)などが高齢者介護の支援を目的に開発した柴犬型の対話ロボット「MICSUS」は、相手の顔の表情から感情を推定したり、手ぶりや頷きなどの動作を読み取ったりして、対話の内容を柔軟に変えることができる。
(日本経済新聞 吉川和輝)
(詳細は現在発売中の日経サイエンス2021年2月号に掲載)