【秘書問題】37%ルール／最適停止問題（Optimal Stopping Problem）【知的雑学トリビア・豆知識】

2024年7月3日 10:59

人は常に選択の連続にある。

秘書問題、または最適停止問題（Optimal Stopping Problem）は、この難問に挑む数学的なアプローチだ。実際の場面では求職活動、投資のタイミング、理想のパートナー探しなどでその重要性が際立つ。

この問題を理解するために、典型的な設定を考えてみよう。
あなたは、n人の秘書候補から最適な一人を選ばなければならない。
一人ずつ順番に面接を行い、その場で採用の決定を下す必要がある。
既に面接を終えた候補者を再度考慮することはできない。どうすれば最適な選択を最大化できるのか？

ここで登場するのが「37%ルール」、別名「1/eルール」だ。
この戦略の基本はシンプル。まず、最初の37%の候補者を観察のみとし、次の候補者から最初の37%の中で最適だった者よりも優れた候補者が現れた時点で採用を決定する。この方法により、最適な候補者を選ぶ確率は約37%となる。

このルールの裏には深い数学的理論があるが、その本質は「観察と行動のバランス」にある。まず一定数のサンプルを観察し、基準を設ける。その後、基準を超えるものが出現したら即座に行動を起こす。これは単なる計算上のテクニックではなく、現実の意思決定にも応用可能な有益な戦略だ。

たとえば、住宅購入のタイミングを考えてみよう。市場を観察する期間を設け、その後最も良い物件を探す。この方法は、冷静な観察と迅速な行動を促し、理想的なタイミングでの購入を実現する可能性を高める。

秘書問題は、最適な選択を求める人々にとっての道しるべだ。観察と行動の絶妙なバランスを見極めることで、最善の選択ができるということだ。これは、私たちの日常生活の中でも多くの洞察を提供してくれる。選択の連続において、どの瞬間に行動を起こすべきか、その知恵を秘書問題から学べるというわけだ。

解説

想像してみてほしい。面接で一人の秘書を選ばないといけないとする。でも、その選び方にはルールがある。候補者たちは一人ずつ順番に面接に来る。その場で「この人を選ぶかどうか」を決めなければならない。
一度「選ばない」と決めたら、もうその人には戻れない。

まず最初に、候補者を観察することにする。例えば、100人の候補者がいるなら、最初の37人を観察だけする。この「最初に観察する人たち」が全体の37％だ。

最初の37％を観察することで、どんな人がいいのか基準を作る。この基準は、次に面接する人たちを選ぶための目安になる。

観察が終わったら、その後に来る候補者たちを面接する。このとき、最初の37％の中で一番良かった人よりも良いと思う人が現れたら、その人を選ぶ。

では、なぜ37％が最適解なのか？それは、たくさんの数学者たちが計算した結果、この方法で最も良い人を選ぶ確率が約37％になるとわかったからだ。

簡単に言えば、最初の37％を観察だけにして、その後に基準より良い人が現れたらすぐに選ぶ方法が、一番成功しやすいということ。これが、「最適停止問題」の解決策で、37％という数字は数学的に証明された結果である。

だから、面接で一番良い秘書を見つけたいなら、最初の37％を観察して、その後にもっと良い人が現れたらすぐに選ぶのが一番良い方法ということになる。

37％ルール、つまり1/eルールがなぜ最適解なのかを数学的に説明しよう。このルールは「最適停止問題」の一種で、特に「秘書問題」として知られている。この問題では、最適な停止時点を見つけるために確率論を用いる。

最適な候補者を選ぶ確率を最大化する戦略を見つける。

観察期間の設定
- 最初のn人のうち、どれくらいの割合を観察のみとするかを決定する。この割合をpとする。
- 最初のpn人を観察し、その中の最高評価者を記録する。
観察後の行動
- 残りの（1-p)n人の中で、観察期間中の最高評価者を超える者が現れたら、その人を即座に採用する。

この戦略がなぜ有効かを理解するために、数学的な期待値と確率を考慮する。

確率計算
- 最初のpn人の観察期間で最高評価者が現れる確率は、ランダムな順序であるため均等に分布している。したがって、最高評価者が観察期間中にいる確率はp。
- 観察期間中の最高評価者よりも良い候補者が残りの（1-p)n人の中に現れる確率は（1-p）n分の1。
- これにより、最適な候補者を選ぶ確率はp × (1 - p)の最大値を考えることになる。
期待値の最大化
- 期待値を最大化するためには、関数p × (1 - p)を最大化する必要がある。この関数は、微分と最適化の手法を用いて解析できる。
- この関数を微分し、0と設定して解くと、p = 1/e という解が得られる。eは自然対数の底で、約2.71828である。
- したがって、p = 1/e ≈ 0.3679、すなわち約37％となる。

この結果に基づき、n人の候補者のうち、最初の37％を観察のみとし、その後の候補者から観察期間中の最高評価者よりも優れた者が現れた時点で即座に採用することが、最適な候補者を選ぶ確率を最大化する戦略となる。これが37％ルールの数学的な裏付けだである。

今後ともご贔屓のほど宜しくお願い申し上げます。