何回買えば揃う?

(H23/9/19 体裁改訂)
H15/02/04

ジュースのボトルキャップや、いわゆる食玩と呼ばれるオマケ付きお菓子にある、○○を集めよう! というアレ。いったい何回買えば全て揃うのだろうか?

MathJAXを使用しているため、IE8 で閲覧する場合は描画が重くなる

また、MathJAX化に伴い内容を整理した。 H23/9/19以前の文書: index20041029.html

期待値

例えば、サイコロで5の目が出る為にはおよそ6回振ればいい。一般に、確率 $p$ の事象であれば $\frac{1}{p}$ 回試行すればいいことになる。これを基に計算してみよう。数学的な詳細は次の節を参照のこと。

ランダムに当たる、$s$ 種類のオマケを全て揃えたい。まず、1回買えば必ずどれかは手に入る。このオマケを $A_1$ と名付けよう。次に、$A_1$ 以外のオマケを当てなければならないので、その確率は $\frac{s-1}{s}$ である。従って $\frac{s}{s-1}$ 回買えば $A_1$ 以外のオマケ $A_2$ が当たることになる。

このようにして、$A_3$ は $\frac{s}{s-2}$ 回、$A_4$ は $\frac{s}{s-3}$ 回・・・と次々に買えば当たることが分かる。勿論、$A_3$ などの名前は「以前に当たったオマケ以外のうちのどれか」を意味し、特定のどれかではない。結局 \[ \sum_{k=1}^{s}\frac{s}{k} \] を求めることになる。$s$ の大きなところでは $s( \gamma + \log (s) ) + 0.5 - \frac{1}{12s}$ に近似できる[1]。$\gamma = 0.57721\cdots$ は Euler 定数である。

以下にオマケの種類が 2 から 20 までの場合における、平均的な必要購入回数を表にした。この回数を多いと見るか少ないと見るか・・・。ちなみに上に挙げた漸近形は $\frac{1}{s}$ で冪展開したものだが、非常に高い精度で一致している。

種類 期待値 漸近形
2 3.0000 2.9990
3 5.5000 5.4997
4 8.3333 8.3332
5 11.4167 11.4166
6 14.7000 14.6999
7 18.1500 18.1500
8 21.7429 21.7428
9 25.4607 25.4607
10 29.2897 29.2897
11 33.2187 33.2186
12 37.2385 37.2385
13 41.3417 41.3417
14 45.5219 45.5219
15 49.7734 49.7734
16 54.0917 54.0917
17 58.4724 58.4724
18 62.9119 62.9119
19 67.4071 67.4071
20 71.9548 71.9548

分散、標準偏差

期待値の計算

試行回数が $\frac{1}{p}$ になるという部分をもう少し詳しく説明しよう。確率 $p$ の事象が $n$ 回目の試行で初めて起こる確率 $P(n)$ は、初めから $n-1$ 回は全て起こらずに $n$ 回目で漸く起こるので、 \[ P(n)=(1-p)^{n-1}p \] となる。従って期待値 $e$ \[ e=\langle n\rangle = \sum_{n=1}^{\infty}nP(n)=\frac{1}{p} \] が得られる。ちなみに、和の計算は $q=1-p$ と置いて $\sum nq^{n-1}=\frac{d}{dq}\sum q^{n}$ とすれば容易に求められる。

オマケを求める場合、この確率 $p$ が各回数で変わっていく。$s$ 種類のオマケがあるとき、各回の確率は $p_k=\frac{s-k}{s}$, ($k=0,1,\cdots,s-1$) あるいは添字の順番を変えて \[ p_k=\frac{k}{s}\ ,\ \ (k=1,2,\cdots, s) \] となる。従って全体の期待値 $E$ は \[ E=\sum_{k=1}^{s}\frac{1}{p_k}=\sum_{k=1}^{s}\frac{s}{k} \] で得られる。

分散、標準偏差

以上の話は飽くまでも期待値を評価しただけなので、少々不十分である。揺らぎがどれだけあるのかを気にしなければならないのである。揺らぎは標準偏差、つまり分散の平方根で与えられる。

各回の分散は、期待値の計算と同様に求められる。まず $\langle n^2\rangle$ は

\[ \langle n^2\rangle = \sum_{n=1}^{\infty} n^2P(n)=\frac{2-p}{p^2} \] これは $pq\frac{d^2}{dq^2}\sum q^n = \langle n^2\rangle -\langle n\rangle$ などから得られる。

よって各回の分散 $v$ は \[ v = \langle n^2\rangle - \langle n\rangle^2 = \frac{1-p}{p^2} \] となる。よって、全体の分散 $V$ はこれの和をとればよく、 \[ V=\sum_{k=1}^{s}\frac{1-p_k}{p_k{}^2}=\sum_{k=1}^{s}\frac{1-(k/s)}{(k/s)^2}=s^2\sum_{k=1}^{s}\frac{1}{k^2}-s\sum_{k=1}^{s}\frac{1}{k} \] この平方根が標準偏差となる。

以下に期待値と標準偏差を載せておく。一番右端の数字は、オマケをコンプリートするために必要な購入回数の大凡の上限値である。

種類 期待値 標準偏差 こんだけ買って
集められなかったら
諦めろ
2 3.0000 1.4142 5
3 5.5000 2.5981 9
4 8.3333 3.8006 13
5 11.4167 5.0173 18
6 14.7000 6.2442 22
7 18.1500 7.4785 25
8 21.7429 8.7185 31
9 25.4607 9.9630 36
10 29.2897 11.2110 42
11 33.2187 12.4621 47
12 37.2385 13.7156 52
13 41.3417 14.9713 58
14 45.5219 16.2289 63
15 49.7734 17.4879 68
16 54.0917 18.7484 74
17 58.4724 20.0101 80
18 62.9119 21.2729 85
19 67.4071 22.5368 91
20 71.9548 23.8015 96

参考文献

  1. 分割数の漸近挙動