テキストデータ分析のキホン－第1回：数字だけでは分からない“理由”を読み解く！テキストデータ分析の全体像【統計学をやさしく解説】

公開日

2026年1月30日

更新日

2026年4月25日

<br />

この記事の主な内容

この記事のポイント

・数字だけでは見えない「顧客や現場の理由」をテキストから読み解く
・テキストデータ分析の 4ステップ（収集／前処理／分析／解釈）
・代表的な 5つの分析手法（頻度・共起・分類・感情・要約）
・AIを味方にする 分析の進め方と注意点

「離職率が15%に上がった」「売上が前月比-8%」「NPSが10ポイント下がった」——定量データは状況を映しますが、原因（＝理由）までは教えてくれません。

理由は大抵、テキストデータの中にあります。

・退職者の面談記録・退職理由メモ
・アンケートの自由回答欄
・カスタマーサポートへの問い合わせログ
・営業の商談メモ・失注理由
・商品レビュー・SNS投稿
・日報・議事録・社内チャット

「数字を見て仮説を立てる」→「テキストを読んで仮説を検証する」というループが、現場で何が起きているかを深く理解する王道です。

数値データとテキストデータの違いと、両者を組み合わせた分析の図

図１：数値データとテキストデータの違い

重要なのは、①〜③はAIに任せて、④に人間の時間を使うことです。現場の文脈・事業の経緯を知っているからこそできる解釈が、最終的な価値を決めます。

出現する語の頻度を数える最もシンプルな方法。「どの言葉がよく出るか」を把握します。たとえば退職理由の自由回答から「人間関係」「労働時間」「評価」といった頻出語を抽出すれば、主要な不満テーマが見えます。

一緒に出てくる語の組み合わせを分析する方法。「人間関係」と「上司」が高頻度で共起していれば、問題の原因がより特定できます。ネットワーク図で可視化すると、問題構造が一目瞭然です。

文章をカテゴリに仕分けする方法。アンケートの1,000件の自由回答を「価格」「品質」「サポート」「デザイン」等のテーマに分類すれば、どこに改善リソースを集中すべきかが見えます。AIはこの分類を数分で実行できます。

ポジティブ／ネガティブ／中立の感情極性を判定する方法。SNSや商品レビューの大量データから「この機能を批判している声の割合」を定量化できます。

大量のテキストを要点のみに圧縮する方法。100件のインタビュー記録を10個のキーメッセージに要約する、といった使い方が有効です。AIが最も得意とする領域の一つです。

たとえば「顧客アンケートの自由回答500件」を分析する場合、次のようにAIを使います。

以下の500件の自由回答を分析してください。
・頻出の不満テーマを5〜7個に分類
・各テーマの件数と代表的な回答例を3つずつ
・改善優先度を「件数×インパクト」の2軸で評価
・改善アクション候補を3つ提案

回答データ：
[自由回答を貼り付け]

ChatGPT／Claude／Geminiのいずれも、このレベルの分析を数分でこなします。重要なのは 出力のテンプレートを指示に埋め込む こと。テーマ数・回答例数・評価軸を固定すると、結果を使いやすい形で受け取れます。