Stanによるベイズ統計学習
公開日
2021年9月29日
更新日
2024年3月4日
Stanによるベイズ統計の導入により、僅かな確率的プログラミングコードの記述だけでいろいろな確率事象の解釈や予測を、格段に多様に捉えることができるようになりました。
但し、新規に統計学を始める人にとって、特に検定の必要ない人にとってStanによるベイズ統計へのアプローチは手探りとなります。Stanに関する本はいくつか出ているものの統計や確率知識を前提とするコード解説であったり、逆に数理説明が中心で現実の分析と結びつかなかったりたりするからです。
当授業は一通りの分析作業を行う実験的学習を繰り返します。RやStanの習得と同時に必用な統計や数理の学習を行う、効率的なベイズ統計の習得を目指すものです。
※講師の山田先生によるStanの解説記事はこちら↓
https://wakara.co.jp/mathlog/20201029
受講内容
ベイズ統計は確率モデルと称される仮定をもとに分析を進めます。確率モデルは単純な確率分布もあれば、複合的でトリッキーなケースもあります。モデル次第で得られる結果は異なりますから、分析のポイントです。授業では代表的な確率モデルを取り上げますが、異なるモデルで分析するなどして確率モデルの特徴や課題を学習します。主な分析プロセスはモデルの検討とコードの記述、パラメータのmcmcサンプリングと予測値の発生、分析となります。授業では条件を様々に設定してデータを作って分析したり、いろいろな検証テーマを設定するなどして実験的な分析を行い統計やStanの理解を深めてゆきます。
[PC環境]
R,RStudio,Rtools,RStanのインストールが必要となります。またRStudioのRマークダウンを利用してプログラミング学習を進めます。Rマークダウンはコードと結果が同時に出力され再現可能なレポート作りができます。
※内容はお客様のご要望等によって変更することがあります。
受講対象
1)統計にはこれまで無縁、しかし確率事象をよく理解したい、やがて活用したい方
2)確定的結論よりもあれこれ検討を加え、多くの人と共有したい方
必要な数学知識
モデルプラン
〇確率や確率分布に関する基礎学習を必用に応じて行います。
*確率事象、確率の公理、ベイズ定理、確率変数、確率密度関数、確率分布関数…
〇各代表的確率モデルについて実験的分析プロセスを実施します。 《代表的確率モデル》
・正規分布関連
・指数分布関連
・二項分布関連
・ポアソン分布関連
・線形回帰関連
・時系列関連
《実験的分析プロセス》
①諸条件でデータを作る(所与データもあり)
②モデルの検討(できるだけ複数考える)
③Stan、Rコード記述(まず可読性の高いコード)
④mcmcサンプリングパラメータチェック
⑤予測値を発生(精度チェック、分析)
参考テキスト
担当講師
※日程により一部講師が変わる事があります。