【和から株式会社】テキストマイニング特別編-アンケート分析-講義抜粋
公開日
2024年12月3日
更新日
2025年4月2日

和から株式会社主催「テキストマイニング特別編-アンケート分析-」の講義の抜粋です。
KH Coderを使い、項目の設計と実際に集計の方法、集計データを分析を行う所まで解説します。
※セミナー開催は終了しております。
テキストマイニングにご興味のある方は無料の「テキストマイニング超入門」へご参加ください。
動画でもご覧いただけます。
この記事の主な内容
オンライン化による転換とその影響
これまで私たちのセミナーは、すべて対面で実施してきました。しかし昨今の事情により開催形式をオンラインへと切り替えることになりました。受講者の皆様と直接お会いできないのは少し寂しくもありますが、オンライン化によってこれまで見えてこなかった新たな課題にも気づかされました。
たとえば、対面セミナーでは長年の経験から「どの時間帯に、どのような層の方が参加しやすいか」といった傾向をある程度把握できていました。しかし、オンラインに移行したことで、これまで蓄積してきたノウハウが通用しない場面も増えてきたのです。
このような変化に対応するため、私たちはアンケート調査を通じて新たなデータを収集し、オンライン参加者の傾向を改めて把握する取り組みを始めました。
アンケート調査の目的と方法
今回実施したアンケートの目的は、オンラインセミナーにおける「最適な開催時間」や「内容に対する満足度」などを明らかにすることにあります。設問には、「はい/いいえ」で答えられる選択式のものから、自由に意見を書いていただける記述式のものまで、幅広い形式を取り入れました。
回答者数は約400名。母集団が1,000人規模であることを考慮すると、統計的にも十分に信頼のおけるデータが得られたといえます。一般に、視聴率調査や選挙予測などでも300~600件のサンプルが使われており、それに匹敵するサンプル数が集まったことで、受講者の傾向を的確に把握できる手応えを得ました。
テキストマイニングを活用した自由記述の分析
自由記述の回答については、すべて目を通すことも可能ですが、それでは膨大な時間がかかってしまいます。そこで、私たちは「KH Coder」というテキストマイニングツールを用いて、効率的に分析を行いました。
このツールを使うことで、個々の意見に隠された共通点や傾向、たとえば「参加しやすい条件」や「改善してほしい点」などのキーワードを客観的に抽出できます。
結果として、主観に頼るのではなく、データに基づいた意思決定が可能になり、より説得力のある施策を考えることができるようになりました。
信頼性の高いデータを集めるために
統計学において、信頼性のあるデータを得るためには、適切なサンプルサイズの設定が欠かせません。
たとえば、信頼水準95%で母集団が1万人という前提であれば、必要なサンプル数は約370人とされています。こうした計算式を活用すれば、根拠のあるデータ収集が可能になります。
今回のアンケートを通じて改めて感じたのは、「信頼できるデータ」があることの強さです。
仮説に対する確信を持つためにも、そしてその先の行動をより良いものにするためにも、データは欠かせない存在なのだと実感します。