AIの執筆・作曲、日本語でも? 自然な文章、フェイク対策課題
先読みウェブワールド (藤村厚夫氏)
2020年はパンデミックの脅威との闘いに明け暮れた感があるが、その間にもAI(人工知能)分野における技術の進展は止まらなかった。筆者が、20年から21年へと続く重要な話題として注目するのが「GPT-3」だ。

GPT-3は膨大な量の自然言語をAIのアプローチで学習して生み出された「言語モデル」のことだ。これに簡単な質問や書き出しの一節などを入力する。たとえば「新型コロナウイルスの時代に人はどう生きるか」などと入力すると、GPT-3はそれに続けるようにして自然な文章を生成してくれる。
20年夏に米国のAI研究機関であるオープンAIがGPT-3を公開するやいなや、世界の研究者や技術者が驚愕(きょうがく)した。生成された文章が、機械的に生み出されたとは思えないような、まさに作品だったからだ。
さらに驚くのは生成できるのが小説やエッセー、哲学、詩といった文章にとどまらないこと。図形やデザインなどを、自然な言葉で指示してやれば、プログラミング言語を使ってウェブページを生成することもできる。人が通常の文章や会話の形式で指示すれば、そのままプログラム化される夢のようなツールをビジネスにしようとする動きすら生じているほどだ。GPT-3を試用したアーティストらにより、楽譜が生成できるという発見もあった。模倣も得意だ。ドストエフスキーやルイス・キャロル風の「ハリー・ポッター」作品を作りだしたという研究者もいる。

もちろん懸念点もある。GPT-3自身に倫理はない。生み出す作品の真偽について自ら問うこともない。つまり指示さえ与えれば、「フェイク」作品をいくらでも作りだせてしまう。米国のある大学生がGPT-3を使って偽ブログを執筆したところ、それが人気ニュースとしてランキング1位を獲得してしまったという。ある掲示板に1分間に1回という膨大な数の投稿を1週間続けて、ようやく機械による投稿と見破られた。どうやら近未来の社会は、GPT-3が創作する精巧なニセ情報に悩まされ続けることになりそうだ。
もうひとつ、GPT-3が膨大に収集して解析した言語モデルは英語が中心だ。話題になっても英語圏だけで、日本には波及してこなかった。
ところが、この点については光が射してきた。20年11月、LINEが韓国NAVERと共同して日本語に特化した超巨大な言語モデルの開発に着手すると発表したのだ。
「100億ページ」以上の日本語データを学習の対象とするとしており、GPT-3の規模に勝るとも劣らない。LINEなどは長文の自動生成やメールへの返信、そしてAIスピーカー製品など音声面への応用をめざすという。これらに加えて、GPT-3同様、外部へも公開するという。これが実現すれば、21年は国内でもAIの活用が話題を呼びそうだ。
もし、日本語での精巧な「創作」が可能になると、たとえば文学賞などへの応募も、まず人によるものか、機械によるものか見極められなければならない。もっとも、これからの時代には「機械生成作品」部門賞を設けた方が建設的かもしれないが。
[日経MJ2021年1月11日付]