短時間で精度の良いモデルを作るコツ!AI×Pythonで学ぶAutoML-特徴量エンジニアリング編-【機械学習自動化第3弾】
- データドリブン活用
- 統計学
- 機械学習
- ChatGPT
- プログラミング基礎
- Python
- マーケティング入門
- データサイエンス
- デジタルマーケティング
- ビジネスツール
- ビジネススキル
- プログラミング
- データ分析
- マーケティング
公開日
2025年1月18日
更新日
2025年1月18日
機械学習を自動化しよう!
データ分析や機械学習に興味はあるけれど、専門的すぎてハードルが高いと感じていませんか?そんな皆さんにおすすめするのが「AutoML(自動機械学習)」です。
第3回となる今回は、作成する機械学習モデルの精度をより高めるための必須スキル「特徴量エンジニアリング」を実践する方法について学んでいきましょう!
AutoMLとは機械学習の分析を行う一連の流れを自動化する技術のことです。一般的に機械学習を使った分析を行うとなったら、
①問題・仮説の定義
②データを予測しやすいように綺麗に加工する(特徴エンジニアリング)
③色々な種類がある機械学習モデルの中から最適なモデルの選定
④精度を高めるためのパラメータ調整(パラメータチューニング)
⑤複数のモデルの性能比較
という操作を繰り返す必要があります。1つ1つの操作を1からPythonで書こうとすると時間がかかってしまうものですが、これらの手順を自動化してコーディングにかける時間を最小限にしようという試みがAutoMLなのです。
様々なAutoMLツールがある中で、今回もPyCaretというライブラリを使ってAutoMLの入門編を学んでいきましょう。これらを使えば、圧倒的に少ないコードで、上記の一連の処理、つまりデータの処理から複数のモデル比較までを行えます。
今回の講義では実際のビジネスの場面でよく見られるデータを使って、特徴量エンジニアリングの流れを体感頂きます。例えば次のような顧客情報のデータでは、何も入力されていない箇所(欠損値)があったり、文字データが入力されていたりと、そのまま機械学習モデル作成には使えないようなデータとなっています。これらを使ってモデルを作成するには、汚いデータを綺麗にする必要や、あるいはより良い予測精度を出すためにデータの加工を行う必要があります。これを特徴量エンジニアリングと言います。
しかし、これらの処理を手書きでコードを書こうとすると非常に大変で、1つモデルを作成出来たころには疲れ果ててしまうことも多いです。そこでPyCaretの出番です。PyCaretを使えば、特徴量エンジニアリングを行うことが非常に簡単にできます(と言いますか勝手に行ってくれます!)。コードを各時間をなるべく短くし、それ以外の考えることに時間を使う、そういった機械学習の一連の流れをご紹介していきます。
もちろん、Python、機械学習の専門知識は不要ですのでどなたでもお気軽にご参加ください。
↓↓↓マーケティング分析がここまで簡単に!AI×Pythonで学ぶAutoML-回帰問題編-!【機械学習自動化第1弾】↓↓↓
https://wakara.co.jp/course/95594
↓↓↓自動機械学習をマーケティング施策に取り入れよう!AI×Pythonで学ぶAutoML-分類問題編-【機械学習自動化第2弾】↓↓↓
https://wakara.co.jp/course/95850
受講対象
・お仕事でデータ分析にかかわる方(マーケティング・人事・販売管理)
・ビジネスにデータサイエンスを導入したい経営者の方
・統計学やデータサイエンスを学びたい方
・機械学習に興味のある方
(数学、統計学が苦手な方でもご参加いただけます。)
セミナー内容
・特徴量エンジニアリングとは
・欠損値の処理
・ワンホットエンコーディング、ラベルエンコーディング
・特徴量選択
・Python言語による実践(顧客の購買金額予測モデル)
※質問内容やディスカッション内容により、上記内容は変更となることがあります。
セミナー基本構成
※開催回ごとに多少構成が変わることがあります。
お持ち物と注意事項
◎PC
◎Googleアカウント
・(Python言語による演習をGoogle Colaboratoryで行うため)
・取得方法の動画はこちら(https://www.youtube.com/watch?v=oM-2S2sBxfI)
※新規アカウント取得はこちらのサイトよりご登録ください。
(https://www.google.com/intl/ja/account/about/)
▼セミナーの催行について
お申し込み人数が最少催行人数に満たない場合、セミナーの開催を【中止】とさせていただくことがございますので予めご了承願います。
【中止】の場合には開催日の7日前までにご登録のメールアドレスにメールにてご連絡いたします。
【中止】となった場合、お支払い済みの料金は全額ご返金いたします。
料金
・お支払い方法はお申込み後にメールにてご案内致します。
・会社名義や旧姓など、振り込み名が本人名義でない場合は事前にご一報下さい
・開催日程間際にお申し込みいただいた場合、初回開催日までにご案内が間に合わない可能性がございますのでご注意ください
定員
特定商取引法に基づく表示
セミナー監修
岡崎 凌(おかざき りょう)
<講師略歴>
「大人のための数学教室・統計教室」経営企画室室長
大阪大学基礎工学部修士。
人工知能(AI)の画像認識モデルを構築。
初学者向けの統計学や、機械学習や人工知能を含む高度な分析手法まで幅広く対応。
データ分析の目的やニーズに合わせてExcel、R言語やPython言語を含むプログラミング言語、BIツールなどソフトウェアを活用する講座を開発し、法人向け研修やセミナーを行う。
分析のコンサルティングも行っており、大手アパレルメーカーの売上分析などを手がける。
<<研修・外部提供講座>>
・澤田経営道場 統計学講師
・株式会社オンラインスクール「誰でも簡単!ビジネス統計学講座」
・株式会社TAC「統計検定® 2級 試験対策講座」
・スポーツ系専門学校 データアナリスト講師
・データ分析コンサルティング(製造、アパレル、美容、医療関連企業等)
他、年間約30社にて法人向け研修を実施。
担当講師
※日程により一部講師が変わる事があります。