サンプルサイズについて

近年では、オンライン上で比較的手軽にアンケートを実施できるようになっている。しかし、結果については、十分に信頼できるものばかりではない。アンケート調査等では、一体どのくらいの人から回答を得れば良いのだろうか。
結果のみを示しているサイトも目立つが、ここでは統計学の理論に沿ってごく簡単ではあるが示していきたい。

統計学の入門テキストでは、必要な標本数(サンプルサイズ)について記述されているものもある。ここで、比率の区間推定の考え方から必要な標本数を算出することができる。アンケートでは、有限の母集団から標本を抽出して行われるものと想定される。この場合の信頼区間は次の通りである。

2z \sqrt{ \cfrac{N-n}{N-1} \times \cfrac{p(1-p)}{n} }

  1. N :母集団の大きさ
  2. n :標本の大きさ
  3. p :母比率
  4. z :z値
ここで、\cfrac{N-n}{N-1}は有限母集団修正係数と呼ばれ、Nが非常に大きいと1に近づく。 また、上記の信頼区間の許容される誤差を\pm e と考えれば、必要な標本数は次のように算出できる。

n = \cfrac{N}{( \cfrac{e}{z} )^2 \times \cfrac{N-1}{p(1-p)} +1}

ちなみに、許容される誤差が±5%の場合、母集団の大きさが10万以上になると必要標本数はあまり変わらない。具体的に検証したいが、またの機会に・・・

(References)
宮川公男, 「基本統計学」, 有斐閣, 1977年
食品のサンプリングに関するガイダンス(NARO食品総合研究所)