このページの分析を自分で再現するには、以下の手順でデータを準備してください。コードの編集は不要です。
data/raw/ フォルダに入れます。html/figures/ に自動保存されます。
う蝕(虫歯)は食生活・生活習慣・生活環境・経済環境など複合的な要因から生じる。本研究では47都道府県の12歳児う歯本数を目的変数に設定し、多角的なデータから主要因を探索する。特に「経済環境」と「家族環境」に着目した。
まず「う蝕罹患に関する要因の研究とよりよい生活の提案」を統計的にとらえることが有効だと考えられる。 その理由は感覚や経験則だけでは、複雑な社会要因の中で「何が本当に効いているか」を見極めにくいからである。 本研究では公開データと統計手法を組み合わせ、この問いに定量的な答えを出すことを目指す。
相関分析 外れ値分析 探索的データ分析 特性要因図
| カテゴリ | 変数 | 出典 |
|---|---|---|
| 目的変数 | 12歳児う歯本数(2019年度) | 厚生労働省「歯科疾患実態調査」 |
| 食生活 | 外食支出 | SSDSE-C |
| 砂糖・菓子類支出 | SSDSE-C | |
| 魚介類支出 | SSDSE-C | |
| (一般的に「甘いものが多い地域はう歯が多い」と思われがち) | ||
| 生活習慣 | 学業行動者率(%) | SSDSE-D |
| スポーツ行動者率(%) | SSDSE-D | |
| 生活環境 | 合計特殊出生率 | SSDSE-B |
| 母子・父子世帯割合(%) | SSDSE-B | |
| 歯科医師数(10万人対) | SSDSE-E | |
| 経済環境 | 消費支出(千円/月) | SSDSE-B |
本教育用コードは合成データを使用(np.random.seed(42))。沖縄県は単親世帯割合・消費支出の特徴を実データに近い形で模擬。
全変数の中で最も強い正相関を示したのは「母子・父子世帯割合」であった。沖縄県は両変数とも極端に高い値を示す「外れ値候補」として注目される。
散布図で外れ値を目視確認するのは探索的データ分析(EDA)の基本。特定の都道府県・国・企業が外れ値になる場合は、その背景を必ず調査する。
9変数全てとう歯本数のピアソン相関係数を、沖縄込み・除外の両方で算出し比較する。「食生活が主要因」という一般的な仮説を検証する。
| 変数 | r(全体) | r(沖縄除外) | 有意性 | 解釈 |
|---|---|---|---|---|
| 母子父子世帯割合 | +0.70 | +0.63 | *** | 育児的余裕の欠如 |
| 消費支出 | -0.54 | -0.46 | ** | 経済的余裕がある → ケア充実 |
| 砂糖・菓子支出 | +0.05 | +0.03 | n.s. | 仮説外れ(菓子 → う歯 は単純でない) |
| 外食支出 | -0.02 | -0.04 | n.s. | 非有意 |
| 歯科医師数 | +0.00 | -0.03 | n.s. | 非有意 |
沖縄県は母子父子世帯割合・う歯本数ともに他県より著しく高い「外れ値」候補である。沖縄県の除外が各変数との相関係数にどう影響するかを系統的に調べる。
外れ値を「感覚」ではなく「基準」で検出する2つの方法。地域別データでは IQR 法が安定していることが多い。
最強の負相関を示した「消費支出」とう歯本数の関係を散布図で確認する。消費支出は経済的余裕の代理変数として解釈できる。
| データ | 出典 |
|---|---|
| 歯科疾患実態調査(12歳児う歯本数) | 厚生労働省(2019年度) |
| SSDSE-B(人口・世帯構造) | 統計数理研究所 |
| SSDSE-C(家計消費支出) | 統計数理研究所 |
| SSDSE-D(社会生活:行動者率) | 統計数理研究所 |
| SSDSE-E(医療・福祉:歯科医師数) | 統計数理研究所 |
本教育用コードは合成データを使用(np.random.seed(42))。沖縄県は実際の統計的特徴に基づいて設定。
統計分析の解釈で初心者がやりがちな勘違いをまとめます。特に「相関と因果の混同」「p値の過信」は研究現場でもよく起きる落とし穴です。本文を読む前にも、読んだ後にも、目を通してみてください。
統計の基本用語を初心者向けに解説します。本文中で見慣れない言葉が出てきたら、ここに戻って確認してください。
統計手法について「何のためか」「結果をどう読むか」を初心者向けに解説します。
この研究をさらに発展させるための3つの方向性を示します。「今回わかったこと(X)」から「次に検証すべき仮説(Y)」を立て、「具体的に何をするか(Z)」まで考えてみましょう。
学んだだけでは身につきません。実際に手を動かすのが最強の学習方法です。本論文のスクリプトをベースに、以下のチャレンジに挑戦してみてください。難易度別に5つ用意しました。
本論文で学んだ手法は、研究の世界だけでなく、行政・企業・NPO の現場でも様々に活用されています。具体的なシーンを紹介します。
この論文を読んで初心者が抱きやすい疑問に、教育的観点から答えます。