/

文書マイニング 集計瞬時

SmartTimes ユーザーローカル社長 伊藤将雄氏

インターネット分野でマイニングといえば、ビットコインなど仮想通貨の採掘作業のイメージが強いかもしれないが「テキストマイニング」という言葉を聞いたことがあるだろうか。テキストマイニングは、文書の中から有益な知見を得るための技術だ。

セミナーやイベントを開催した場合、参加者アンケートを取る企業は多いと思う。アンケート票には選択式の設問だけではなく、自由記述欄を設けるのが一般的だ。結果を集計するとき、選択式の設問ならばエクセルなど表計算ソフトを使って定量的に件数を集計すればよい。一方、自由記述項目の場合はそのままでは集計が難しい。

生の声を一件一件じっくり読んでいけば参考になる意見は多いのだが、件数に比例して時間がかかってしまうという問題がある。また、インパクトが強い意見に全体の印象が引っ張られてしまいがちになるといった問題も生じる。

そんなときに使えるのがテキストマイニングだ。大量の文章データから特に重要な名詞や形容詞を抽出したのち、統計的な処理を加えて文書全体の特徴を取り出すことができる。

テキストマイニングをしたい場合、これまでは専用ソフトが必要で、インストール作業も面倒という理由から気軽に使うのが難しく、学問研究などで使うケースに限られていた。

そこで当社では、無料のテキストマイニングツールを開発し、セットアップなしでウェブブラウザーからだれでも使えるようにした(https://textmining.userlocal.jp/)。アクセスして入力フォームにアンケート結果の自由記入の項目を入力するだけで、頻出名詞やそれにひもづく形容詞を自動集計して表示する。たとえ数百人分のアンケートの設問であっても即座に集計が完了する。

テキストマイニングでは、単純に回数をカウントするだけでなく、一般に出てきやすい単語については重みを軽く、反対にめったにない単語は重要なものとして評価する、といった統計処理を加えている。

最近では、この仕組みを使い、クチコミデータをプロダクト開発に生かしたり、特許調査に使ったりするケースも増えている。

たとえばある商品カテゴリーのレビューをテキストマイニングする場合、特定の商品名がどのぐらい出現するのかや、その商品にどんな形容詞や動詞が結びついているかを素早く調査できる。類似のものをグルーピングするクラスタリングも可能だ。複数の商品で評価がどのように異なっているのかも瞬時に把握できるのでぜひ試してほしい。

現在は文字データの処理がメインではあるが、今後は音声認識AIと組み合わせることでコールセンターへのクレーム電話をマイニングしてサービス改善に生かす、といった活用方法も普及していくだろう。

[日経産業新聞2018年8月29日付]

すべての記事が読み放題
有料会員が初回1カ月無料

関連企業・業界

セレクション

トレンドウオッチ

新着

注目

ビジネス

ライフスタイル

新着

注目

ビジネス

ライフスタイル

新着

注目

ビジネス

ライフスタイル

フォローする
有料会員の方のみご利用になれます。気になる連載・コラム・キーワードをフォローすると、「Myニュース」でまとめよみができます。
新規会員登録ログイン
記事を保存する
有料会員の方のみご利用になれます。保存した記事はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン
Think! の投稿を読む
記事と併せて、エキスパート(専門家)のひとこと解説や分析を読むことができます。会員の方のみご利用になれます。
新規会員登録 (無料)ログイン
図表を保存する
有料会員の方のみご利用になれます。保存した図表はスマホやタブレットでもご覧いただけます。
新規会員登録ログイン