ジュースのボトルキャップや、いわゆる食玩と呼ばれるオマケ付きお菓子にある、○○を集めよう! というアレ。いったい何回買えば全て揃うのだろうか?
MathJAXを使用しているため、IE8 で閲覧する場合は描画が重くなる。
また、MathJAX化に伴い内容を整理した。 H23/9/19以前の文書: index20041029.html
例えば、サイコロで5の目が出る為にはおよそ6回振ればいい。一般に、確率 $p$ の事象であれば $\frac{1}{p}$ 回試行すればいいことになる。これを基に計算してみよう。数学的な詳細は次の節を参照のこと。
ランダムに当たる、$s$ 種類のオマケを全て揃えたい。まず、1回買えば必ずどれかは手に入る。このオマケを $A_1$ と名付けよう。次に、$A_1$ 以外のオマケを当てなければならないので、その確率は $\frac{s-1}{s}$ である。従って $\frac{s}{s-1}$ 回買えば $A_1$ 以外のオマケ $A_2$ が当たることになる。
このようにして、$A_3$ は $\frac{s}{s-2}$ 回、$A_4$ は $\frac{s}{s-3}$ 回・・・と次々に買えば当たることが分かる。勿論、$A_3$ などの名前は「以前に当たったオマケ以外のうちのどれか」を意味し、特定のどれかではない。結局 \[ \sum_{k=1}^{s}\frac{s}{k} \] を求めることになる。$s$ の大きなところでは $s( \gamma + \log (s) ) + 0.5 - \frac{1}{12s}$ に近似できる[1]。$\gamma = 0.57721\cdots$ は Euler 定数である。
以下にオマケの種類が 2 から 20 までの場合における、平均的な必要購入回数を表にした。この回数を多いと見るか少ないと見るか・・・。ちなみに上に挙げた漸近形は $\frac{1}{s}$ で冪展開したものだが、非常に高い精度で一致している。
種類 | 期待値 | 漸近形 |
---|---|---|
2 | 3.0000 | 2.9990 |
3 | 5.5000 | 5.4997 |
4 | 8.3333 | 8.3332 |
5 | 11.4167 | 11.4166 |
6 | 14.7000 | 14.6999 |
7 | 18.1500 | 18.1500 |
8 | 21.7429 | 21.7428 |
9 | 25.4607 | 25.4607 |
10 | 29.2897 | 29.2897 |
11 | 33.2187 | 33.2186 |
12 | 37.2385 | 37.2385 |
13 | 41.3417 | 41.3417 |
14 | 45.5219 | 45.5219 |
15 | 49.7734 | 49.7734 |
16 | 54.0917 | 54.0917 |
17 | 58.4724 | 58.4724 |
18 | 62.9119 | 62.9119 |
19 | 67.4071 | 67.4071 |
20 | 71.9548 | 71.9548 |
試行回数が $\frac{1}{p}$ になるという部分をもう少し詳しく説明しよう。確率 $p$ の事象が $n$ 回目の試行で初めて起こる確率 $P(n)$ は、初めから $n-1$ 回は全て起こらずに $n$ 回目で漸く起こるので、 \[ P(n)=(1-p)^{n-1}p \] となる。従って期待値 $e$ \[ e=\langle n\rangle = \sum_{n=1}^{\infty}nP(n)=\frac{1}{p} \] が得られる。ちなみに、和の計算は $q=1-p$ と置いて $\sum nq^{n-1}=\frac{d}{dq}\sum q^{n}$ とすれば容易に求められる。
オマケを求める場合、この確率 $p$ が各回数で変わっていく。$s$ 種類のオマケがあるとき、各回の確率は $p_k=\frac{s-k}{s}$, ($k=0,1,\cdots,s-1$) あるいは添字の順番を変えて \[ p_k=\frac{k}{s}\ ,\ \ (k=1,2,\cdots, s) \] となる。従って全体の期待値 $E$ は \[ E=\sum_{k=1}^{s}\frac{1}{p_k}=\sum_{k=1}^{s}\frac{s}{k} \] で得られる。
以上の話は飽くまでも期待値を評価しただけなので、少々不十分である。揺らぎがどれだけあるのかを気にしなければならないのである。揺らぎは標準偏差、つまり分散の平方根で与えられる。
各回の分散は、期待値の計算と同様に求められる。まず $\langle n^2\rangle$ は
\[ \langle n^2\rangle = \sum_{n=1}^{\infty} n^2P(n)=\frac{2-p}{p^2} \] これは $pq\frac{d^2}{dq^2}\sum q^n = \langle n^2\rangle -\langle n\rangle$ などから得られる。
よって各回の分散 $v$ は \[ v = \langle n^2\rangle - \langle n\rangle^2 = \frac{1-p}{p^2} \] となる。よって、全体の分散 $V$ はこれの和をとればよく、 \[ V=\sum_{k=1}^{s}\frac{1-p_k}{p_k{}^2}=\sum_{k=1}^{s}\frac{1-(k/s)}{(k/s)^2}=s^2\sum_{k=1}^{s}\frac{1}{k^2}-s\sum_{k=1}^{s}\frac{1}{k} \] この平方根が標準偏差となる。
以下に期待値と標準偏差を載せておく。一番右端の数字は、オマケをコンプリートするために必要な購入回数の大凡の上限値である。
種類 | 期待値 | 標準偏差 | こんだけ買って 集められなかったら 諦めろ |
---|---|---|---|
2 | 3.0000 | 1.4142 | 5 |
3 | 5.5000 | 2.5981 | 9 |
4 | 8.3333 | 3.8006 | 13 |
5 | 11.4167 | 5.0173 | 18 |
6 | 14.7000 | 6.2442 | 22 |
7 | 18.1500 | 7.4785 | 25 |
8 | 21.7429 | 8.7185 | 31 |
9 | 25.4607 | 9.9630 | 36 |
10 | 29.2897 | 11.2110 | 42 |
11 | 33.2187 | 12.4621 | 47 |
12 | 37.2385 | 13.7156 | 52 |
13 | 41.3417 | 14.9713 | 58 |
14 | 45.5219 | 16.2289 | 63 |
15 | 49.7734 | 17.4879 | 68 |
16 | 54.0917 | 18.7484 | 74 |
17 | 58.4724 | 20.0101 | 80 |
18 | 62.9119 | 21.2729 | 85 |
19 | 67.4071 | 22.5368 | 91 |
20 | 71.9548 | 23.8015 | 96 |