独立行政法人統計センター主催 統計データ分析コンペティションの受賞論文を、 実データ・Pythonコードとともに教育用に再現したものです。 各ページではデータの取得方法・統計手法・分析コードを学べます。
統計データ分析コンペの受賞論文を「教材」として再構成したサイトです。 各論文ページは、初心者でも分析の流れを追えるように、以下の9つのセクションで構成されています。
🔬 完全再現可能: 各論文には Python スクリプトが付属しています。
SSDSE データを data/raw/ に置くだけでコードを編集せず実行できます。
合成データは一切使っていません(全て実データ)。
何から読めばいいか迷ったら、以下の順番で読み進めるのがおすすめです。
LASSO や Random Forest で「効く変数」を発見。
※ 下の「タグで絞り込む」を使うと、手法やデータごとに論文を一覧できます。
| 年度 | 論文数 | 公開済み | 状況 |
|---|---|---|---|
| 2025年度 | 19 | 19 (100%) | 完了 |
| 2024年度 | 20 | 20 (100%) | 完了 |
| 2023年度 | 20 | 20 (100%) | 完了 |
| 2022年度 | 40 | 40 (100%) | 完了 |
| 2021年度 | 19 | 19 (100%) | 完了 |
| 2020年度 | 19 | 19 (100%) | 完了 |
| 2019年度 | 14 | 14 (100%) | 完了 |
| 2018年度 | 8 | 8 (100%) | 完了 |
data/raw/ フォルダに配置してからコードを実行してください。