記事

ミクロな合理性を積み上げると、マクロな不合理が生まれるとき

1/2
二人組の強盗がいた。彼らはあちこちの現場で盗みを働き、世の中を荒らし回ってきたが、最後の仕上げとばかりに、「一世一代の大仕事」に取り組んだ。銀行強盗である。二人は大胆にも白昼、覆面姿で銀行に押し入り、大金を奪って逃げた。

だが、警察もメンツを潰されたまま黙ってはいない。草の根を分けて二人を追いかけ、とうとう別々の場所でほぼ同時期に、二人を逮捕した。でも二人とも、銀行から奪った大金は身につけておらず、どこかに隠してしまったらしい。二人が銀行強盗の犯人だという、客観的な証拠は見つからないのだ。

警察は彼らを勾留したものの、証拠があがっているのは別の微罪だけ。いわば、別件逮捕の形になった。とはいえ、なんとか二人に銀行強盗の罪を白状させたい。警察は、二人を別々の独房に入れ、お互いに相談できない状態にした上で、取り調べを続けた。だが、なかなか二人は自白しない。そこで、ある日、一人にこう持ちかけた。

「お前さん、このまま銀行強盗の件でシラを切り続けたら、どうなるか分かっているな? すでに証拠の上がっている窃盗罪で、確実に1年は刑務所暮らしだ。しかしな、ここで取引しよう。お前さんが、相棒と組んでやった銀行強盗の罪を、自分から認めるなら、反省して警察に協力してくれたということで、無罪放免にしてやる。」

「えっ、無罪放免。」

「そうだ。司法取引ってやつだ。銀行強盗の罪とくれば、ふつうはまず、二人とも刑期5年だろうな。だがもしお前が自分から、この銀行事件の捜査に積極的に協力してくれたら、別件の窃盗も含めて、全部チャラにしてやろう。そのときは、非協力的で反省の色がないお前の相棒は、まあ7年は食らい込むことになるだろう。」

「取調官の旦那。前にも言いましたが、そんな相棒なんてヤツのことは知りませんぜ。」

「ふっ、まだ、とぼけるつもりかよ。まあ、よく考えろ。この取引が成立するのは、お前の相棒が否認し続けた場合のことだ。お前より先に、あいつが銀行強盗の件を自白したら、どうなると思う? まるきり逆の立場になる。お前は7年の刑務所ぐらし、あいつは無罪放免だ。はやく本当のことを白状するほうが身のためだぞ。さあ、どうする?」

その国には司法取引の制度があった。だから、取調官のいうことは単なるハッタリではなさそうだ。では、この強盗は、どうすべきか。否認を続けるか、自白するか。あなたなら、どうするだろうか?

この問題が難しいのは、相方がどう出るかが、分からないためだ。ふつうのビジネス問題に置き換えれば、相手の行動は自分が決められないから、自分にとってのビジネス環境に相当する。つまり、環境条件において、リスクが有るのである。そこで、こういうときは次のような表を作って、場合分けして考えてみる方が良い。

横軸は、自分の行動だ。否認と自白の二つがある。そして縦軸は、相方の行動である。これも、否認と自白がある。マス目の中の数字は、それぞれの行動を自分と相手が取ったときに、結果として自分が刑務所に入る年数が入っている(年数が長いほうが損なので、マイナスの数字になっている)。

こういう表を、『利得表』Pay-off matrix と呼ぶ。利得表で考えるときは、縦に見比べてはいけない。それは、自分の行動を中心にした、いわば自己中の見方だ。横に見て、比較するのである。相手がとる行動ごとに、自分はどちらをとるべきかを考える。

まず、相手が否認し続けたら、どうなるか。その場合、自分も否認すれば、銀行強盗の罪は証拠不十分で問われないけれど、別件の窃盗罪で1年の刑期となる。だが、自分が自白すれば、司法取引が成立して、無罪放免になる。

では、相手が自白したら、どうなるか。自分も自白した場合、二人そろって5年ずつ、刑務所生活を送ることになる。だが、自分が否認したら? そうなると、相棒の側に司法取引が成立し、自分は反省の色がないということで7年間のムショ暮らしになってしまう。

結局、相手が否認した場合も自白した場合も、自分は自白する方が、被害は少ないことが分かる。前者の場合は、−1年(否認) > −5年(自白) だし、後者では、0年(否認) > -7年(自白) である。

したがって、このようなケースでは、相手がどう出ようとも、自分は自白する方が合理的であることが分かる。リスクのある不確実な環境下では、自分の被害を最小化する行動が良い。これを『リスク最小化の原理』と呼ぶ。

これで意思決定の問題は解決した。一件落着。・・と、言いたいが、じつはこの話は、まだ先がある。

よく考えてみてほしい。自分と相棒の置かれた条件は、鏡に写したように、まったく同じなのである。だとしたら、相棒も同じように考えて、「自白」を選ぶはずではないか? そして、二人が「自白」を選んだら、どうなるか。二人そろって、5年間ずつ、刑務所の塀の中で過ごすのである。

次の表を見てほしい。これは、利得表の中に、二人組が課せられる刑期の年数の合計値が書いてある。

これを見る限り、二人にとって一番良いのは、そろって否認し続けるケース(合計マイナス2年)である。そして最悪なのは、二人とも自白するケースで、合計マイナス10年になってしまう。

二人組は、構成員わずか2名ながら、小さな組織だと考えることができる。この表が示しているのは、組織の構成員がそれぞれ、もっとも合理的だと考える行動をとると、組織全体としては最悪の結果を生んでしまうケースが有る、という事実だ。

ミクロな最適化を積み上げても、マクロな最適は生まれない。あるいは、各人がその持ち場で最善を尽くせば、全体で最善の結果が得られる保証はない。そういう事を、この事例は示している。このようなケースを、ゲーム理論では『囚人のジレンマ』と呼んでいる。

ゲーム理論は、物理学者のフォン・ノイマンと経済学者のモルゲンシュテルンが確立した、戦略研究に関する応用数学の分野で、現在では主に経済学の中に組み入れられている。ゲーム理論では、「全プレイヤーが最適行動をとっており、かつ、どのプレーヤーも自分の戦略を変更すると期待利得が減ってしまうような、戦略の組み合わせ」を『ナッシュ均衡』と呼ぶ。

ナッシュ均衡からずれた行動を選ぶと不利益が生じるので、ある種の安定した状態を示す。上の例では、二人が「自白する」ことがナッシュ均衡になっている。

あわせて読みたい

「コミュニケーション」の記事一覧へ

トピックス

  1. 一覧を見る

ランキング

  1. 1

    致命傷にはならないだろうが、やはり菅さんが受けた傷は深い

    早川忠孝

    02月25日 19:06

  2. 2

    「過去最大の赤字よりマズい」電通が五輪中止より恐れている"最悪のシナリオ"

    PRESIDENT Online

    02月25日 19:10

  3. 3

    迷走続ける菅政権 首相を苦しめる「成り上がり」のジレンマ

    御田寺圭

    02月25日 10:59

  4. 4

    【読書感想】ロシアを決して信じるな

    fujipon

    02月25日 10:14

  5. 5

    久保田智子44歳 20代で「子供は難しいでしょう」…特別養子縁組で親になるまで 「文藝春秋」3月号「巻頭随筆」より - 久保田 智子

    文春オンライン

    02月25日 15:33

  6. 6

    スター・ウォーズファンたちが熱狂の『マンダロリアン』 日本のサムライ影響?

    BLOGOS映像研究会

    02月26日 07:09

  7. 7

    2020年代の産業革命

    ヒロ

    02月25日 10:48

  8. 8

    ワクチン確保に慌てる必要なし 政府批判は動きを非効率化させる危険も

    中村ゆきつぐ

    02月25日 07:19

  9. 9

    「またも看板キャスターが降板」NHKは"忖度人事"をいつまで続けるのか

    PRESIDENT Online

    02月25日 22:35

  10. 10

    森会長の発言ってどうしてここまで叩かれてるの?と思った時に読む話

    城繁幸

    02月25日 15:53

ログイン

ログインするアカウントをお選びください。
以下のいずれかのアカウントでBLOGOSにログインすることができます。

コメントを書き込むには FacebookID、TwitterID のいずれかで認証を行う必要があります。

※livedoorIDでログインした場合、ご利用できるのはフォロー機能、マイページ機能、支持するボタンのみとなります。