データ分析の結果を左右するデータクレンジング講座
公開日
2022年7月10日
更新日
2024年8月18日
データのきれいさが分析結果を決める
データ分析をビジネスの世界で使おうとデータサイエンスを学んだ。しかし実際に分析を始めてみると社内に保存されているデータがきれいなものではなく、それをきれいにするのに四苦八苦…という経験はないでしょうか?
このように現場できれいな形でデータが保存されていることは稀で、たいていの場合は分析ができる形にデータを変換する必要があります。汚いままのデータを使って分析を行ってもなかなかきれいな分析結果は出てこないでしょう。
例えば以下の営業部の社員データを見てみましょう。こちらデータに汚いところが多々ありそのままでは分析ができません。このように汚い形でデータが保存されている状況はよく見かけます。
データクレンジングのスキルを高める
汚いデータをきれいにする作業をデータクレンジングあるいはデータクリーニングと言います。これは分析結果の質を高めるうえで分析者に求められる必要不可欠なスキルとなります。しかし、Excelを用いてひとつずつセルの値をきれいにしていくという操作を行っていては、それだけで1日が終わってしまい、本筋の分析を行う体力は残っていない…という状況も珍しくありません。そこで弊社では、この時間のかかるデータクレンジングを効率的に行えるツールを開発し、そのデータクレンジングに焦点を当てたセミナーを作成いたしました。
クレンジングツールを使って効率的に処理
弊社が開発したデータクレンジングツール(Data Wash)は、どなたでも簡単にマウスの操作のみで(プログラミングは必要なしに)クレンジングが行えるツールです。こちらを使ってクレンジングの処理方法はもちろん、データを保存する際の考え方までデータクレンジングの世界をご紹介いたします。
Data Washの特徴1:簡単な操作
データの読み込みから処理に至るまですべてマウスの操作で可能です。一切のプログラミングを必要としません。
Data Washの特徴2:再現性
Data Washではすべての処理を履歴として残します。処理を間違えた際や、やり直しを行いたいときに過去の1時点に戻るという操作が簡単にできます。
Data Washの特徴3:データクレンジングに特化した機能
Excelだと時間がかかる操作を短時間で行えるように設計しています。
・表記ゆれ処理機能
・列の分割、結合機能
・文字列の置き換え機能
・欠損値の処理機能
・ワイド型データとロング型データの変換機能
・2つのデータセットの結合機能
Etc…
データのクレンジングはData Washを使用して行いますが、データの集計の自体はExcelを用います。
Excelの操作に不安のある方は「初めて学ぶデータ利活用-Excel編-」をご受講ください。
欠席しても動画受講が可能
「出席できない日がある」、「後から復習したい」という向けに2つの特典付き!
1.講義動画の配信
欠席・出席に関わらず「1年視聴可能な講義動画」を配信しています。
2.詳細手順付き講義資料
講義資料を丁寧に作りこみ、後から見ても理解できる構成です。(Excel演習がある講義は操作手順も詳細に記載)
【ストロングポイント】
・デザイナー監修の講義資料
・操作手順まで1つずつ丁寧に記載
・復習して再現性が高く、必ず習得できる
※今後の開催日程については、順次公開いたします。詳細はお問い合わせください。
受講対象
Excelをお仕事で使っている方
データの集計業務にかかわる方
統計分析を一通り学んだ方
社内データを使ってデータ分析を行う必要がある方
ビジネスに活かせるスキルを習得したい方
セミナー内容
第1回 セル単位のクレンジング1
- ・データクレンジングの概要
- ・表記ゆれの処理
- ・異常値の処理
- ・セルの縦方向分割
- ・セルの横方向分割
- ・欠損値の処理(統計量保管法)
第2回 セル単位のクレンジング2
- ・データのレコードの解釈
- ・トランザクションデータとマスターデータ
- ・トランザクションデータからLTV(顧客生涯価値)計算
- ・ピボットテーブルによるデータレコードの粗さ変換
- ・データの各種結合法
第3回 データ構造のクレンジング
- ・ワイド型データの意味とその利点
- ・ロング型データの意味とその利点
- ・ワイド型データとロング型データの変換
- ・データ入力を行う際の考え方
- ・利便性が高くなるデータの構造
セミナー基本構成
(各回10分程度の休憩時間を含みます。)
※開催回ごとに多少構成が変わることがあります。
お持ち物と注意事項
Windows:Microsoft Excel 2016 以降
Mac :Microsoft Excel 2016 for Mac 以降
※Office 365(サブスクリプション)版も対応可能です。
料金
定員
特定商取引法に基づく表示
セミナー監修
川原 祐哉(かわはら ゆうや)
<講師略歴>
自社のデータ分析・データ管理を行いつつ、実務で使える統計を社会人に教える講座を実施中。
ビジネスマンの統計リテラシーの向上を目指し行う授業は、統計初心者にもわかりやすいと好評。またRやpythonを用いた統計解析の個別指導も実施。
〈インタビュー掲載〉
週刊ダイヤモンド2019年2/9号
担当講師
※日程により一部講師が変わる事があります。