『統計学が最強の学問である』
西内啓著より。
ざらっと読んだだけです。その中の基の基を。
統計はデータを取れば取るほど良いというわけではないのだそう。
一般には費用対効果の関係で、8000人のデータを担保することがベターとのこと。
理由は以下の通り。
・100人のサンプルの誤差は4.6%。
例えば、ある商品の購買性別を調査した100人のサンプルデータのうち、女性の購買割合が70%だった場合は、誤差を計算に入れると61-79%の間になるとのこと。
・1000人のサンプルの誤差は1.4%。
この場合、先程同様の調査結果であれば、誤差は67-73%。
・8000人のサンプル誤差は0.5%
同様にこの場合の誤差は69-71%まで誤差が少なくなる。
これ以上はあまり意味がないそうです。
多くの費用をかけてサンプルを用意しても、
・10000人のサンプル誤差は0.4%
・20000人のサンプル誤差は0.3%
ということで、殆ど差が無くなってくる。
そのほんの僅かな差を勘定に入れる必要がある調査対象か、その場合のコストと収益は?ということが理由です。
その上で、この三つの問いについて答えられないとやる意味ないのだそうです。
その問いは、
・何かの要因が変化すれば利益は向上するか。
・そうした変化を起こすような行動は実際に可能なのか。
・変化を起こす行動が可能だとしてそのコストは利益を上回るか。
なるほどなぁという感じです。
恐らく取っ付き易い分類の書籍と思います。
気になられた方はどうぞ。