中国、5秒で記事10本 AIが自動作成

36Kr
スタートアップGlobe
アジアBiz
コラム(テクノロジー)
2020/6/2 2:00 (2020/6/2 5:38更新)
保存
共有
印刷
その他

人工知能(AI)の重要分野であるNLP(自然言語処理)。その活用分野として最も大きな潜在力を秘めているのがAIライティング(自動作文)だ。中国でも2015~16年にかけてテンセント、新華社、バイトダンス傘下のニュースアプリ「今日頭条(Toutiao)」が報道分野でこの技術を活用するようになったが、ここでの競争のカギを握ったのが、AIライティングの独創性と読みやすさだった。こうした中で注目されるのがコンテンツ制作ロボットを開発する「深圳市智搜信息技術(GIISO)」。膨大なデータ蓄積と、独自のアルゴリズムという強みを生かして、5秒で10本の記事を自動作成する高性能なシステムを開発、政府やメディア、マーケティング会社など多くの顧客にAIによる文書などのコンテンツの作成サービスを提供している。

キーワードなどを入力するだけで自動で記事を作成してくれる(GIISO提供)

キーワードなどを入力するだけで自動で記事を作成してくれる(GIISO提供)

AIによるNLPは現在、主に検索、質問応答システム、そしてAIライティングの3分野で活用されている。このうち検索はほとんどグーグルやバイドゥ(百度)という世界的な検索エンジン運営企業が握っている。質問応答システムは応用範囲が広いことに加え、マンマシンインターフェース技術の洗練や製品標準化などの面で問題があるため、実用化はもう少し先になりそうだ。それに対し、AIライティングの可能性は大きく、特に書面文書の処理能力はすでに円熟の域に達している。2007年に試用が始まり、2014年には米国連邦準備制度(FRS)が自然言語生成エンジン「Wordsmith」で財務関連ニュースを作成。同年にはWordsmithの開発元「Automated Insights」社が作成した文書が10億件に達した。

こうした中、2013年に設立されたGIISOはその後わずか5年で製品を世に送り出した。メディア、マーケティング、広報、政治、経済関連の企業サービスと個人ユーザーを対象にコンテンツ制作をSaaS(必要なソフトウェアを必要とされる分だけ提供するサービス)の形で提供している。

独創的で読みやすいコンテンツを制作するには、大量の素材を蓄積することと、的確なアルゴリズムという中核技術が必要となる。GIISOはマーケティング、情報、金融分野のナレッジグラフを作成し、ノード数は億に上る。またこれら三分野に関する文章、段落、文、情報などの素材に絶えずアノテーション(データを分類しやすくする属性タグをつける作業)を行っており、中でもマーケティング関連の素材はすでに50億を超えた。アルゴリズムは、WikiAnswers、Quora、TCNPlatform、LCQMC(Large-scale Chinese Question Matching Corpus)など専門の訓練用データセットを利用し、人間の監修なしで言語を生成するモデルを開発、100億以上の文章による訓練を重ねて、独創的な記事を生み出している。5秒以内に1000~2000文字から成る10本のオリジナル記事が作成でき、読みやすさを示す「可読性」の比率は80%ほどになる。

自動で記事を作成するシステムは政府機関や企業などで導入されている(GIISO提供)

自動で記事を作成するシステムは政府機関や企業などで導入されている(GIISO提供)

メディア、金融、マーケティング関連の企業や政府機関に対しては、SaaSを通じてリポートやニュース作成を支援している。システムはまずビッグデータとアルゴリズムに基づいて、人々が関心を持つ事柄を洗い出し、5秒で複数の草稿を作成する。次にユーザーが自動作成された原稿を確認し、意向が反映されていない箇所を修正する。この時点でAIは素材の推薦、他の記事との重複比較、訂正などの補助機能を発揮する。最後に、ネットで公開される記事は、AIのアルゴリズムがキーワードのタグ付けを行い、SEO(検索エンジンへの最適化)対策を施した見出しと記事が自動的に作成される。

一方、メディア関連の中小企業顧客や個人ユーザーに対しては、オフィシャルサイト(www.giiso.com)によるコンテンツ作成サービスを提供している。操作の流れはSaaSとほぼ同じだが、各企業のコンテンツシステムとは接続する必要がない。ユーザーが作成した記事の拡散を支援し、利用料は月間料金、年間料金、単一記事料金を設定、記事のシェア数に応じたディスカウント制も設け、記事1本を入力すれば何十もの派生記事を生成するなどのサービスも提供する。将来的には著作権者と共同で、画像、ライブ、ショートビデオのコンテンツ作成も計画している。また同システムへのリンク紹介者にコミッションを与える戦略を展開する。

GIISOの収益は主にSaaSを利用する企業顧客からの年間サービス料金だが、社内で使用するアカウント数に応じた料金徴収や、1回当り100万元(約1500万円)を超えるプロジェクト報酬という形もある。「経済日報(Economic Daily)」「深圳報業(Shen Zhen Press Group)」「中国太平洋保険(China Pacific Insurance)」「上海証券取引所(ShanghAI Stock Exhange)」に加え、警察や政府機関などが大口顧客となっており、2018年~2019年にかけての売上高は1000万元(約1億5000万円)を超えた。今年は重点的に個人ユーザー(中小企業顧客を含む)を狙う。

同社のスタッフは約20人。共同創始者の一人、鄭海涛氏は清華大学電子計算機学部の准教授で、800を超える国家プロジェクトを任されるビッグデータとテキストマイニングのエキスパートだ。GIISOは2017年にシリーズAで「民銀資本(CMBC Capital)」「金沙江創業投資基金(GSR Ventures)」などから2000万元(約3億円)を調達し、今はシリーズBの募集中だ。

「36Kr ジャパン」のサイトはこちら(https://36kr.jp/)

中国語原文はこちら(https://36kr.com/p/683253808710024)

 日本経済新聞社は、中国をはじめアジアの新興企業の情報に強みをもつスタートアップ情報サイト「36Kr」を運営する36Krホールディングスに出資しています。同社の発行するスタートアップやテクノロジーに関する日本語の記事を、日経電子版に週2回掲載します。
保存
共有
印刷
その他

電子版トップ



[PR]