Pythonの統計分析ライブラリ「statsmodels」を学ぶためのガイドブックとJupyterノートブック集です。
- statsmodels_guide.pdf - 統計分析の基礎から応用まで網羅した日本語ガイドブック
| ファイル | 内容 |
|---|---|
| 00_setup.ipynb | 実行環境のセットアップ |
| 01_visualization.ipynb | データ可視化 |
| 02_linear_regression.ipynb | 線形回帰モデル |
| 03_glm.ipynb | 一般化線形モデル(GLM) |
| 04_time_series.ipynb | 時系列分析 |
| 05_statistical_tests.ipynb | 統計検定 |
| 06_discrete_choice.ipynb | 離散選択モデル |
| 07_robust.ipynb | 頑健な統計手法 |
| 08_nonparametric.ipynb | ノンパラメトリック手法 |
| 09_panel_data.ipynb | パネルデータ分析 |
| 10_survival.ipynb | 生存時間分析 |
| 11_multivariate.ipynb | 多変量解析 |
| 12_case_studies.ipynb | ケーススタディ |
各ノートブックには★〜★★★★★の5段階難易度の練習問題が含まれています。
各ノートブックはGoogle Colabで直接開くことができます:
- GitHubでノートブックファイルを開く
- 「Open in Colab」ボタンをクリック、または
- URLの
github.comをcolab.research.google.com/githubに置き換える
# リポジトリをクローン
git clone https://github.com/kkawailab/kklab-statsmodels-tutorials.git
cd kklab-statsmodels-tutorials
# 必要なパッケージをインストール
pip install statsmodels pandas numpy matplotlib seaborn scipy jupyter
# Jupyter Notebookを起動
jupyter notebook notebooks/- 第0章: セットアップ → 第1章: 可視化 → 第2章: 線形回帰 → 第5章: 統計検定
- 第3章: GLM → 第4章: 時系列 → 第6章: 離散選択 → 第12章: ケーススタディ
- 第7章: 頑健手法 → 第8章: ノンパラメトリック → 第9章: パネルデータ → 第10章: 生存分析 → 第11章: 多変量解析
statsmodels
pandas
numpy
matplotlib
seaborn
scipy
scikit-learn
一部の章では追加パッケージが必要です:
- 第9章(パネルデータ):
linearmodels - 第10章(生存分析):
lifelines - 第12章(GARCH):
arch
MIT License