マスログ

2021/02/02

おすすめのカフェを探す!100件超の口コミを瞬時に集計するテキストマイニング

皆さんは飲食店やカフェなど、お店探しで迷ったことはないでしょうか。私も研修などで遠出する際、早めに現場付近に到着してからカフェを探すことがよくあります。

慣れない場所だと「食べログ」「ぐるなび」等を頼りに飲食店を検索するのですが、店名や写真だけ見てもイマイチ差が分からず、迷ってしまいがちです笑

食べログに掲載されている様々な飲食店。店名と写真だけだと、どこが良いか判別がつきません。

そんな時に多くの方が参考にするのが口コミだと思います。実際に利用した方が注文したメニューや、味や接客などの感想は、初めていくお店選びでは貴重な情報になります。

飲食店選びの強い味方「口コミ」。

ただ、ただでさえ多い飲食店に紐づいている口コミを一つ一つ読んでいては、せっかく早めに着いて空いた隙間時間がなくなってしまうでしょう。そこで、今回は口コミをテキストマイニングによって集計してみようと思います!

例えば神奈川県武蔵小杉駅周辺のカフェを見てみましょう。この中で、例えば「おやつ研究所」の口コミを集計してみます。

武蔵小杉「おやつ研究所」の口コミを集計して、使用頻度の高い単語をまとめた「抽出語リスト」。

この集計結果は「抽出語リスト」と呼ばれ、口コミで多く使用されている語を確認することができます。圧倒的にタルトの頻度が大きく、人気商品であることが伺えますね。集計するだけではなく、グラフにして可視化しましょう。

どの単語の組み合わせが多いかを可視化した「共起ネットワーク」。

このグラフは共起ネットワークと呼ばれる、一緒に使用される単語同士が線で結ばれたグラフです。例えば「タルトー食べるー美味しい」や、「研究所ーカフェー歩く」など、タルトの感想を投稿している方が多いことや、立地について駅からは少し歩く距離にあることなどが分かります。

さらに、他のカフェとも比較してみてみましょう。

武蔵小杉周辺の人気カフェを、使用されている単語によって比較(バブルチャート)。

このヒートマップを見ることで、それぞれのカフェで何が人気なのかをまとめることができますね。考え方としては、マーケティングにおける「ポジショニング分析」に近い分析を、口コミデータから行うことができます。チョコ好きの筆者としては、パティスリー・パリセヴェイユが第一候補となるでしょう。皆さんはどのお店に行ってみたいですか?

数値データと比較して扱いが難しいテキストデータですが、ツールやプログラミングを駆使することで実は簡単に集計・分析を行うことができます。特に今回はツールのみで、プログラミングも使用していません。

テキストデータを分析する方法についてご興味がある方は、こちらの無料セミナーにお越しください。

テキストマイニング超入門-言葉を分析して把握する-

それではごきげんよう。

<文/岡崎 凌>
⇒ 講師紹介ページへ