2018年11月20日(火)

文書マイニング 集計瞬時
SmartTimes ユーザーローカル社長 伊藤将雄氏

コラム(ビジネス)
2018/8/29付
保存
共有
印刷
その他

インターネット分野でマイニングといえば、ビットコインなど仮想通貨の採掘作業のイメージが強いかもしれないが「テキストマイニング」という言葉を聞いたことがあるだろうか。テキストマイニングは、文書の中から有益な知見を得るための技術だ。

1997年早大政経卒、ビジネス誌出版社に入社。2000年楽天入社。02年に学生時代に開発した「みんなの就職活動日記」を事業化し、04年に楽天に売却。05年にユーザーローカル設立。

1997年早大政経卒、ビジネス誌出版社に入社。2000年楽天入社。02年に学生時代に開発した「みんなの就職活動日記」を事業化し、04年に楽天に売却。05年にユーザーローカル設立。

セミナーやイベントを開催した場合、参加者アンケートを取る企業は多いと思う。アンケート票には選択式の設問だけではなく、自由記述欄を設けるのが一般的だ。結果を集計するとき、選択式の設問ならばエクセルなど表計算ソフトを使って定量的に件数を集計すればよい。一方、自由記述項目の場合はそのままでは集計が難しい。

生の声を一件一件じっくり読んでいけば参考になる意見は多いのだが、件数に比例して時間がかかってしまうという問題がある。また、インパクトが強い意見に全体の印象が引っ張られてしまいがちになるといった問題も生じる。

そんなときに使えるのがテキストマイニングだ。大量の文章データから特に重要な名詞や形容詞を抽出したのち、統計的な処理を加えて文書全体の特徴を取り出すことができる。

テキストマイニングをしたい場合、これまでは専用ソフトが必要で、インストール作業も面倒という理由から気軽に使うのが難しく、学問研究などで使うケースに限られていた。

そこで当社では、無料のテキストマイニングツールを開発し、セットアップなしでウェブブラウザーからだれでも使えるようにした(https://textmining.userlocal.jp/)。アクセスして入力フォームにアンケート結果の自由記入の項目を入力するだけで、頻出名詞やそれにひもづく形容詞を自動集計して表示する。たとえ数百人分のアンケートの設問であっても即座に集計が完了する。

テキストマイニングでは、単純に回数をカウントするだけでなく、一般に出てきやすい単語については重みを軽く、反対にめったにない単語は重要なものとして評価する、といった統計処理を加えている。

最近では、この仕組みを使い、クチコミデータをプロダクト開発に生かしたり、特許調査に使ったりするケースも増えている。

たとえばある商品カテゴリーのレビューをテキストマイニングする場合、特定の商品名がどのぐらい出現するのかや、その商品にどんな形容詞や動詞が結びついているかを素早く調査できる。類似のものをグルーピングするクラスタリングも可能だ。複数の商品で評価がどのように異なっているのかも瞬時に把握できるのでぜひ試してほしい。

現在は文字データの処理がメインではあるが、今後は音声認識AIと組み合わせることでコールセンターへのクレーム電話をマイニングしてサービス改善に生かす、といった活用方法も普及していくだろう。

[日経産業新聞2018年8月29日付]

「日経産業新聞」をお手元のデバイスで!

 スタートアップに関する連載や、業種別の最新動向をまとめ読みできる「日経産業新聞」が、PC・スマホ・タブレット全てのデバイスから閲覧できるようになりました。申し込み月無料でご利用いただけます。

 

今なら有料会員限定記事もすべて無料で読み放題

保存
共有
印刷
その他

関連企業・業界 日経会社情報DIGITAL

電子版トップ



[PR]

日本経済新聞社の関連サイト

日経IDの関連サイト

日本経済新聞 関連情報