第12章 ゲーム理論
<本章の目的>
複占や寡占市場下の企業行動においては、自社の行動が他社の利潤に直接影響を与えるため、自社の行動が他社の行動の変化を引き起こし、それがさらに自社の利潤に影響を与えるということを考慮した上で自らの行動を決定させざるを得ない。そこで本章では、このような行動を分析するための手法としてゲームの理論について見てい。

☆1.囚人のジレンマ
>1. ゲーム理論
寡占市場の分析でみたように、企業をはじめとする経済主体の行動は他者の行動によって自己の行動が決定される相互依存関係にある。このような相互依存状態をゲームとよび、経済主体間の行動の相互依存関係を分析する手法がゲーム理論である。相互依存関係にある行動の例として囚人のジレンマとよばれる次のようなゲームを考えよう。

ある事件の容疑者2人(A、B)が別件逮捕され、別々に取調べを受けている。
2人が共に黙秘すれば別件で2年の刑に、共に自白すれば5年の刑に、そして1人だけ自白すれば自白者は1年、黙秘者は10年の刑に服することになるとする。

なお、 ゲームの参加者をプレーヤーといい、ここでは容疑者Aと容疑者Bである。
プレー ヤーのとりえる選択肢を戦略といい、ここでは黙秘と自白である。
ある戦略を選んだ結果プレーヤーの得る利益を利得といい、ここでは懲役期間(1年、2年、5年、 10年)である。

このような戦略と利得の関係は図表12-1のような利得行列で表わすことができる。
表のなかで左の数値はAの利得、右の数値はBの利得を表わしている。
たとえば、 容疑者Aが自白、容疑者Bが黙秘するとき、懲役はAが1年、Bが10年となるので、
利得は(-1,-10) と表わされる。

図表12-1
P176



>2.ナッシュ均衡と囚人のジレンマ
相手の戦略を予想したうえで、利得を最大化するような自己の戦略を最適反応という。
相手の戦略が自己の予想と一致し、かつ自己の戦略が相手の予想と一致するとき、このような戦略の組 み合わせをナッシュ均衡とよぶ。ナッシュ均衡においては、どのプレーヤーにとっても戦略を変更する誘因は存在しない。図表12-1においてナッシュ均衡は次のように求められる。

人囚。『
容疑者Aの最適反応を求めると、
A-① :容疑者Bが黙秘ならば自白が最適反応(-2<-1)
A-②:容疑者Bが自白ならば自白が最適反応(-10<-5)

容疑者Bの最適反応を求めると、
B-① :容疑者Aが黙秘ならば自白が最適反応(-2<-1)
B-②:容疑者Aが自白ならば自白が最適反応(-10<-5)

ここで、お互いに自白を選ぶA-②とB-②の組み合わせは、互いの戦略が互いの予想と一致するナッシュ均衡である*1。
*1ゲームによってはナッシュ均衡が存在しないケースや複数存在するケースもある。

お互いに自白を選ぶとき、戦略を変更す る誘因は存在しない。なぜなら、B (A)が自白のままA (B)が黙秘に戦略を変更すると、Aの利得は-5から-10に低下してしまうからである。

ところで、このとき互いに黙秘していればともに懲役2年というより高い利得、 つまり、パレート最適な結果を得ることができるにもかかわらず、両者が合理的に行動した結果、ともに懲役5年という低い利得しか得ることができない。 このよう な状況を囚人のジレンマという。たとえば、因人のジレンマは、企業間の値引き競争による共倒れなど現実にも多く見られる。


>3.支配戦略とナッシュ均衡
プレーヤーの最適反応となる戦略が一つだけ存在するとき、そのような戦略を支配戦略とよぶ。
図表12-1のゲームでは、容疑者Aも容疑者Bも相手の戦略にかかわらず、最適反応は自白のみなので、自白が支配戦略となる。
すべてのプレーヤーに いで支配戦略が存在するとき、すべてのプレーヤーが支配戦略をとる均衡を支配 均衡とよぶ。
図表12-1では、お互いに自白を選ぶ組み合わせが支配戦略均衡であり、これはナッシュ均衡でもある。このように、支配戦略均衡は必ずナッシュ均衡となるが、 反対にナッシュ均衡が必ずしも支配戦略均衡であるとは限らない。

たとえば、図表12-2のゲームでは、プレーヤーAにとってはプレーヤーBの戦略にかかわらず、戦略A1が最適反応となるので、A1が支配戦略となる。

一方、プレーヤーBにとってはプレーヤーAの戦略によって、最適反応が異なる(A1に対いしてはB1、A2に対してはB2)ので、支配戦略が存在しない。

しかし、プレーヤーAがA1しか選ばないことを前提とすれば、フレーヤーBは最適反応であるB1を選べばよいことが分かる。このとき均衡となる戦略の組み合わせ (A1, B1)はナッシュ均衡でもある。

図表12-2  利得行列②
P177

*1『サム(sum)」は英語で「合計」の意味であり、ゼロサムゲームはゼロ和ゲームともよばれる。


☆2. ゼロサムゲームとミニマックス原理
>1. ゼロサムゲーム
プレーヤーの利得の合計がゼロとなるゲームをゼロサムゲームという*1。
ゼロサムゲームは図表12-3のように表わされる。このゲームのプレーヤーは個人Aと個人Bであり、
戦略はそれぞれa1, a2とb1, b2である。

利得表に描かれているのは、個人Aの利得であり、Aがa1、Bがb1を選ぶとき、Aの利得はー4, Bの利得は4となり、利得の合計がゼロになる。
たとえば、土地の分配問題などがゼロ ムゲームの例である。

図表12-3 ゼロサムゲーム
P178



>2.ミニマックス原理
(1)マックスミニ戦略
ゼロサムゲームでは、自分にとっての損失は相手にとっての利益となるという特徴がある
よって、相手が利益の最大化をはかろうとするなら、相手はこちらにとって最悪の戦略をとると予想することができる。このときの最適な戦略とは、自己にとって最小(ミニ)の利得を最大(マックス)にするような戦略である。これをマックスミニ戦略とよぶ。
図表12-3において個人Aのマックスミニ戦略は次のように求められる。

A-①:a1を選ぶとき、最小利得はー4 -4(Bがb1<5(Bがb2)
Aー② : a2を選ぶとき、最小利得はー2   2(Bがb2)>-2(Bがb2)
よって、最小利得を最大にするような戦略はa2 (ー4<(ー2)である。

(2) ミニマックス戦略
ゼロサムゲームでは、相手にとっての利益は自分にとっての損失となるという特徴がある。
よって、相手が利益の最大化をはかろうとするなら、相手はこちらにとって最悪の戦略をとると予想することができる。
このときの最適な戦略とは、自己にとって最大(マックス)の損失を最小(ミニ)にするような戦略である。 これをミニマックス戦略とよぶ。
図表12-3において個人Bのミニマックス戦略は次のように求められる
B-①:b1を選ぶとき、最大損失は2 -4(Aがa1) < 2(Aがa2)
Bー②:b2を選ぶとき、最大損失は5    5(Aがa1)  >ー2(Aがa2)
よって、最大損失を最小にするような戦略b1(2<5)である。

(3) ミニマックス原理
マックスミニ戦略もミニマックス戦略も、相手がこちらにとって最悪の戦略をとることを前提に損失を最小に抑えようとする戦略であることに違いはない。
各プレーヤーがこのように行動することをミニマックス原理とよび、図表12-3のようなゼロサムゲームにおいて各プレーヤーがミニマックス原理に基づき戦略を選ぶとき、戦略の組み合わせは(a2, b1) となる。