Do I Call or Fold? ベイズの定理 Part 1

Bayes’ Theorem: A Mathematical Tool for Navigating Poker’s Uncertainty

Sharelines

  • Do I Call or Fold? ベイズの定理 Part 1

さあ、あなたがどれだけ冴えているかを見るために一つの問いかけから始めましょう。
ポーカーへの応用は後々明らかになります。

あるタクシーが夜に轢き逃げ事故に巻き込まれました。
二つのタクシー会社、緑と青が市街で稼働しています。
あなたには以下のデータが与えられます。

  • 市街を走るタクシーの85%は緑であり、15%が青である。
  • 目撃者はタクシーが青だったとみなしている。
  • 法廷は、事故の夜に存在したものと同じ状況の下で目撃者の信頼性をテストし、当時目撃者が2色を正しく確認できたのは80%であり20%は失敗すると結論づけました。

事故に巻き込まれたタクシーが青であった可能性はどれくらいですか?
本稿を読み進める前にあなたの答えを出すため、1分時間をとってください。

準備はいいですか?

この2部構成の記事では、私はベイズの定理と呼ばれる数学的概念を紹介するつもりです。
要するに、未知の可能性の見通しを改善するために、不完全な情報を使用する方法です。

ご存知の通り、これはポーカーにおいても絶えずやってくるタスクです。
例えば、シート4にいる男性がブラフしてくる可能性はどれくらいでしょうか? そして彼の癖を見抜いた時私たちの予測は変わるのでしょうか?
ベイズの定理は最も正確な答えに到達する方法を示してくれます。

しかしこの定理に十分に精通するにはいくらかの時間と努力が必要です。
このツールをあなたの引き出しに加えたいのであれば、私がポーカーとは異なる例を用いて説明する間、しっかりと私についてきてください。
来週の第2部ではこれをどのようにポーカーに応用するかをお見せします。

タクシーは青だったのか緑だったのか?目撃者の信頼性と事前確率の統合

タクシー問題は実験心理学の世界では有名なものの一つです。
これは人々が意思決定をする際に欠陥のある方法をとってしまうということについて書かれた最も重要な本であり、Daniel Kahneman氏、Paul Slovic氏、そしてAmos Tversky氏によって記されたJudgment Under Uncertainty: Heuristics and Biasesで見ることができます。

”命題の大多数はこの問題とわずかに異なるバージョンで、非常に一貫した結果を提示しました”と著者は記しています。
”最も一般的な回答は.80であり、これは目撃者の信頼性とも一致し、青と緑の相対度数にも影響されない値です。”

ですからあなたの回答が80%でしたら、流石・・・ しかし誤りです。
多くの人々と同じように考えてしまっていたとしたら、おそらく二つの情報をないまぜにしてしまったのでしょう:即ち目撃者の信頼性、そして青と緑のタクシーの相対数です。

それでは本当の答えを求めていきましょう。
コトを単純化するために、パーセンテージの代わりとして整数を使用し、市街には100台のタクシーがあり、緑のものが85台、青のものが15台としましょう。

タクシーが青であった場合、目撃者はそれを80%の確率で青と正しく認識し、そして20%の確率で緑であると誤認します。
同様にタクシーが緑であった場合、彼女はそれを80%の確率で緑と正しく認識し、そして20%の確率で青であると誤認してしまうのです。

これらの情報を用いて小さな一覧表を作りましょう:

 緑タクシー青タクシー合計
目撃者は緑と認識68371
目撃者は青と認識171229
合計8515100

タクシーが緑であるとき、目撃者は80%の確率で正しく認識します。
85台の緑のタクシーですと、68台を緑として、そして17台を青としてしまうのです — 20%も間違えるのです。
これが一覧表の最初の列です。

同様に、青のタクシーを目撃しても12台は正しく認識しますが3台は誤認します — これも80%と20%ですね。
これが一覧表の2列目です。

もし全100台のタクシーを走らせたら、彼女は71台を”緑”と、そして29台を”青”と、”合計”の列にあるように声を上げることでしょう。

これこそが極めて重大な問題なのです:目撃者がタクシーは青だと言った時、それが本当に青である可能性はどれくらいでしょう?
それは一覧表の2行目から推察できます。
識別した29台の青のタクシーの内、本当に青である者は12台にすぎず、残り17台は緑であるのです。

そして、最終的な回答は、目撃者が青と証言した場合、本当に青である可能性は29台中たった12台で、およそ41%です。
たった2色しか可能性はないのですから、緑のタクシーである可能性は100%から41%を引いた59%であることがすぐにわかりますね。

これの意味するところを考えましょう。
目撃者の信頼性が80%もあるにもかかわらず、タクシーが青だったと証言した時に実際には緑であることのほうが多いのです!
これが人間の認識力には難があるという問題部分ですね。

正解は青よりも緑のタクシーがとても多く存在するという事実に大きく依存しています。
これは、青と緑のタクシーの数が異なる他の都市を検討するのに役立つかもしれません。

もしこの事件が99台の緑のタクシーと1台の青のタクシーが走る市街で起こったなら、あなたは目撃者が”青”と証言したとしても、青のタクシーが非常に珍しいというだけのことでそれは誤りであると直観するでしょう。
逆に1台の緑のタクシーと99台の青のタクシーが走る市街で起こったなら、彼女はほぼ確実に正しいのです。

どちらの場合も、私たちは彼女が証言する前に、彼女が完ぺきな認識能力を持ってでもいない限りは、99%のほうであると彼女の言葉よりも事実に重きを置いて、妄信してしまうでしょう。
彼女のエラーに関する傾向は、彼女の証言が私たちの市街におけるタクシーの分布に関する知識の力の前にその重要性を薄れさせてしまうことを意味しています。

その知識はベイジアン用語で事前確率と呼ばれています — 即ち証拠がないままに何かしらの要素を確率とすることです。
元々の質問で、私たちは15%の確率から始めました。
100台のタクシー中15台が青であるので、どの目撃者が証言する前でも、我々は事件に関係するタクシーが青であったという可能性は15%であると言うでしょう。

不完全なテスト結果を分析するために事前確率を用いる

ベイズの定理を教えるための最も一般的な例は — そして、実は、30年ほど昔に学んだことがあったのですが — 大体の場合において不完全である、医療検査です。

丁度ニューズでジカウィルスについて流れているので、これを例としてみましょう。
メイン州の医師は、発熱、発疹、頭痛、そして関節の痛みを伴う患者がいます。
患者は最近旅行していません。
ジカウイルスに対する新しい検査がちょうど利用可能となったと思ってください。
被験者がジカ熱を患っていた場合90%がポジティブで、そうでなかった場合99%ネガティブという反応が出るとのことです。
(これらが目撃者の信頼性が2つの色について同じだったタクシー問題とどのように違うのか注意してください)

私たちは事前確率を定める必要があります。
ニューイングランドに旅行していない患者がジカ熱を持っていない可能性はどのくらいでしょう?
可能性としては他にも同様に、例えばライム病のような数ダースや数百程度のウィルスやバクテリア、寄生虫といったものの兆候、加えて狼瘡のような非感染性のものもあります。
メイン州にはジカ熱の感染者はいませんでした。
それではこの患者がジカ熱を持つ事前確率をおよそ100万分の1と定めましょう。
つまり、100万人中99万9999人はジカ熱以外の何かを持っているということです。

前回作成したものと同じような一覧表を作りましょう:

 ジカ熱保有別物合計
ジカ熱テストポジティプ0.9010,00010,001
ジカ熱テストネガティブ0.10989,999989,999
合計1999,9991,000,000

一番下の行から始めて、100万人にたった1人がジカ熱を持つという設定で埋めます。
それから最初の列では被験者の90%が正しく識別されたことを示しています。
他の99万9999人にとっては次の列で99%(999,999 x 0.99 = 989,999)が正しくネガティブと識別されたことが示されていますし、誤ってポジティブとなったのもその他1% (999,999 x 0.01 = 10,000)です。

大きな結論が出ましたね。
最初の行は本当に陽性である人は10001人に1人である一方、偽陽性である人は10001人に10000人ということを示しています。
言い換えると、事前確率が小さすぎるために、これほどエラー確率の小さい優れたテストであっても正しい結果が見えなくなってしまい、テストする価値がないということです。

しかし今度はジカ熱が大暴れしているブラジルで同じテストを敢行するとします。
患者の10%がジカ熱を持ち、90%はそれ以外とします。
結果はどのように変動するでしょう。

 ジカ熱保有別物合計
ジカ熱テストポジティプ90,0009,00099,000
ジカ熱テストネガティブ10,000891,000901,000
合計100,000900,0001,000,000

一覧表はこのように埋まりました。

テスト固有の正確さはそのままですが、人口の特徴は大きく変わりました。
結果として私たちの結論も変更を余儀なくされます。
今度はジカ熱に陽性である(最初の列)のは90000人であり、9000人が偽陽性です。
つまり私たちの患者がジカ熱を持つ可能性は90,000/99,000、つまりおよそ90%です。

今回はとても価値あるテストだったとわかるでしょう。
この患者がジカ熱を持つという可能性に対する我々の評価は、ポジティブな試験結果に基づき、10%(事前確率)から90%に変わります。

ベイズの定理は事前確率を不完全なテスト結果と量的に結合します。
しばしば片方が片方を支配してしまうこともあります。

さて、これがベイズの定理の作用に関する基本的な考え方です。
今やあなたはこれをポーカーに応用する準備が出来ているのです。
来週の第二部をお楽しみに。
もしかしたらオレオクッキーと、テディという黒子が関与するかもしれません。

Photo: Blue & Pink Taxi (modified), Johnny Lai. Creative Commons Attribution 2.0 Generic.

ポーカーニュース日本語版のツイッター及びフェイスブックでも様々なポーカーニュースを更新しています。
公式フェイスブック
https://www.facebook.com/PokerNewsJapan/
公式ツイッター
https://twitter.com/pokernewsjp

More Stories

どう思われますか?