データが増えると間違える??

投稿者: | 2017年6月26日

概要

  • サンプル数が増えると、間違えが増えてしまう例を紹介
  • サンプル数を十分に増やせないなら、いっそ 1 サンプルだけの方が良い場合がある

クジ or 定額

次のような問題を考えます。

当たりが出ると 100ドル、外れると何ももらえないクジがある。

このクジを引くか、クジを引かずに 55 ドルを確実にもらうのではどちらが得か?

クジが当たる確率は知らされていないが、何回かクジの結果を見せてもらえる。

クジの当たる本当の確率は 60% とします。

クジを引いた時の期待値が 60 ドルなので、

クジを引いたほうがお得になります。

ただし、当たる確率は知らされてないのでそれを推定しなければいけません。

 

1 回だけクジの結果を見せてもらう場合

クジを引くか定額かのどちらかを決める前に、

クジの結果を一度だけ見せてもらえるとしましょう。

クジの結果は当たりかはずれのどちらかです。

 

もし、クジが当たっていれば、

雑に見積もって 100% 当たりのクジと考えられます。

そうすると、クジの期待値は 100 ドルなので、

クジを引いたほうが良いという結論になります。

 

もし、クジが外れていれば、

当たりは 0% のクジと雑に見積もられます。

そうすると、クジの期待値は 0 ドルなので、

クジを引かないほうがいいという結論になります。

 

本当はクジの当たる確率は 60% なので、

100人が同じことをすると、

60人はクジを選び

40人は定額を選ぶこととなります。

2回だけクジの結果を見せてもらえる場合

今度は、2回クジの結果を見せてもらえる場合を考えましょう。

1回だけの時に比べて判断材料が増えているので、

より上手い選択ができると期待されます。

 

2回クジを引いた時の結果は、

当たりの数で考えると、

当たりが0回、1回、2回のどれかになります。

 

当たりが0回の時、

当たる確率は雑に0%と見積もられるので、

クジの期待値は0ドルで、

定額の報酬を選びます。

 

当たりが1回の時、

当たる確率は50%と見積もられるので、

クジの期待値は50ドルですが、

定額で55ドルもらう方が特に思えるので、

定額を選びます。

 

当たりが2回の時、

当たる確率は100%と見積もられるので、

クジの期待値は100ドルであり、

クジが選ばれます。

 

当たりが0回ということは、2回ともはずれなので、

そのような結果になる確率は0.4×0.4 = 0.16 つまり、16%です。

同様に、当たりが1回となるのは、48%、

当たりが2回となるのは、36%です。

 

当たりが0回、または、1回の場合に定額を選ぶので、

100人中64 人は定額を選び、

残りの36人がクジを選ぶことになります。

パラドックス

何かおかしなことが起こっていることにもうお気づきでしょうか?

上の結果を表にまとめてみます。

クジを引いた数(サンプル数)が1の時は、クジを選ぶ確率は60%

サンプル数が2の時は、クジを選ぶ確率は36%です。

 

そして、クジの本当の期待値は60なので、

クジを選ぶ方が本当はお得であることを思い出しましょう。

 

サンプル数が1の時よりも、サンプル数が2の時の方が、

間違った選択をする確率が増えていることが分かります。

 

サンプル数が増えるほうが、判断に使える情報が増えるので、

直感的に考えると、より正解を選べるようになる気がします。

ところが、実際には逆のことが起こる場合があることを、

この「クジor定額」問題は示唆しています。

不思議だと思いませんか?

考察

なぜこのようなことが起きるのでしょう。

簡単に答えてしまうと、確率の推定値がサンプル数によって離散化されるからです。

 

サンプル数が1のときは、確率の推定値は

0/1=0%, 1/1=100% のどちらかになります。

 

サンプル数が2のときは、確率の推定値は、

0/2=0%, 1/2 = 50%, 2/2=100% の3つの値になります。

 

本当の確率は60% なので、

上のどの推定値も外れていることが分かります。

 

1/2=50% はそこそこ近いのですが、これが一番悪さをしています。

当たる確率が50%であるという推定からは、

期待値が50ドルであるという推定が得られるのですが、

これは、定額の方が得だという間違った結論を与えてしまいます。

 

サンプル数がもっと大きくなれば、

確率の推定値はより細かく刻まれるので、

本当の確率60%に近く、

期待値も60ドルに近い値を推定できるようになり、

クジの方が得だという正しい選択ができる確率が増えていきます。

まとめ

サンプル数が小さい場合には、

サンプル数が増えると逆に誤った選択をしてしまうという

直感に反した結果となる例を紹介しました。

「情報を集めるよりも、一回で決めてしまう」方がいい場合もあるようですね。

実生活で同じような例はあるでしょうか?

 

この話をより一般化した話が“記事:選択に迷ってしまうのは何故か?”になるので、

そちらの記事も是非ご覧下さい。

 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です