シンプソンのパラドックス
「集団全体の性質と、集団を分けた時の性質が異なる」現象は、シンプソンのパラドックスと呼ばれている。例えば「年収1000万円以上、年収500〜1000万円未満、年収500万円以下のどの階層でも、平均所得が上がっている」といった場合、必ずしも景気が回復しているとは限らない。不景気になり、全員の所得が2割減ったとすると、高所得者の中で比較的低所得だった人が高所得者から低所得者のカテゴリに移る場合がある。その結果、低所得者全体の平均を押し上げ、カテゴリの平均所得は上昇する。「それぞれのカテゴリの平均所得が上昇すると同時に、貧しい人の割合が増える」という状態は、実際に不景気が深刻化する局面で起きる事がある。
待ち行列
行列の平均待ち時間は次の公式で求められる。平均待ち時間=稼働率/(1−稼働率)×1人あたりの会計時間
稼働率が0.8(10分間で8人が並ぶ)の時、会計に1人1分かかるとすると、平均の待ち時間は、0.8/(1−0.8)×1分=4分
稼働率が1に近づくと、急激に待ち時間が増えてしまう。逆に稼働率を半分(0.4)にすると、0.67分になる。つまり、稼働率は半分にしただけで、待ち時間は1/6になる。
ベイズの定理
がんの人が要精密検査とされる率は約90%だという。これはつまり「健康診断で胃X線検査が要精密検査だった場合、胃がんの可能性が非常に高い」と言えるのか。
この場合、次の仮定をたててみる。
①「がんにかかっている人」1000人に1人(0.1%)
②「がんの人が要精密検査になる率」90%
③「本当はがんではないのに、精密検査に回される率」10%
・がんで陽性反応あり:0.1%×90%=0.09%
・がんでないのに陽性反応あり:99.9%×10%=9.99%
陽性反応がでる率は0.09%+9.99%=10.08%
この内、がんにかかっている確率は0.09/10.08=約0.9%
健康診断で胃X線検査が要精密検査だった場合に、実際にがんである確率は1%にも満たない。このように、結果から原因の確率を計算する定理を「ベイズの定理」という。人はインパクトのある数字を見ると、確率的に稀な事を過大評価してしまいがちである。「個々の比率だけを見て、全体の比率を見ない」のは、本質を見誤る原因である。
バースデーパラドックス
あるクラスに23人の生徒がいる。彼・彼女らの内、同じ誕生日の人がいる確率は何%か。この確率は50.7%もある。
まず23人の中で「あなたと同じ誕生日の人」がいる確率は約6.1%に過ぎない。私達が最初に頭に思い描くのは「自分と同じ誕生日の人」がいる確率で、それは確かにとても小さい。ところが23人の人がいる時、「どの誕生日でも良いから、同じ誕生日のペアが1組以上になる確率」であり、そもそも前提が異なる。
一般にn通りある場合、50%になるのは、およそ1.18√n人集めた時になる。1.18√365=22.5人となる。
平均
100回サイコロを振るといった、不規則な数字でも、たくさんの回数で平均を取ってみると、だんだんと真の平均値に近づいていく。これを「大数の法則」と言う。
(1+2+3+4+5+6)÷6=3.5
サイコロを振る回数を増やしていくにつれ、徐々に3.5に近づいていく。この大数の法則には必ず「前提」がある。その前提は「真の平均が存在する」という事である。数学には「真の平均が存在しない」場合がある。
例えば、ダーツ実験によると、極端に0から外れた値が出るため、大数の法則が成り立たない。つまり、平均が存在しない事になる。