標本調査より精度の劣る悉皆調査

webちくま「この国の教育にいま、起きていること」苅谷剛彦第5回 教育政策の路線変更と全国学力テストの意味常識と異なる専門家の見方*1経由で、調査研究協力者会議等 全国的な学力調査の実施方法等に関する専門家検討会議(第3回)議事概要−文部科学省を読んでみた。

 客観的なデータを取ることが重要である。悉皆調査で一番懸念されることは、成績の悪い子どもを休ませたり、学力調査の結果において高いパフォーマンスを得るための特別な努力をすることで、データが変質してしまうことである。取ったデータがすでに変質してしまっていれば、それをどれだけ分析しても意味がない。

ある社会的集団の特徴を把握するために、その集団から一部の人だけを選んで調査を行う*2場合に、えてして調査対象者数は多ければ多いほど偏りの少ないデータが得られる、と考えがちだ。実はそうではなくて、調査対象の数より選び方のほうが大切だ*3ということはこれまでに何度も*4指摘してきた。
しかし、特徴を把握しようとしている社会的集団に属する人全員に対して調査を行う*5なら対象の選び方に由来する偏りについては考える必要がないのだから、悉皆調査のほうが標本調査よりも偏りの少ないデータを得ることができるはずだ、とこれまでずっと思いこんでいた。
確かに統計理論上は悉皆調査のほうが標本調査よりも質の高いデータが得られる。だが、実際には理論が想定していない要素が紛れ込むため、必ずしもそうは言えない。上の例では、高い精度を求めて悉皆調査を実施するというまさにそのことがデータの精度を下げるという逆説的な状況*6だ。これは意外だった。
もっと精進が必要だ。反省。

*1:HTMLのタイトルはみな「webちくま「この国の教育にいま、起きていること」苅谷剛彦」だが、便宜上、リンク文字を変更した。

*2:これを標本調査または抽出調査という。

*3:もちろん、対象者の人数は一切考慮する必要はない、というわけではない。個人差を相殺して偏りをなくすため、ある程度の人数は確保しておかなければならない。

*4:直近ではここ

*5:これを悉皆調査または全数調査という。

*6:余談だが、危険回避策が危険を増大させるという、モラルハザード現象を連想した。