学位論文要旨



No 115749
著者(漢字) 清水,崇
著者(英字)
著者(カナ) シミズ,タカシ
標題(和) 協調問題と社会的情報
標題(洋) The Coordination Problem and the Social information
報告番号 115749
報告番号 甲15749
学位授与日 2001.02.14
学位種別 課程博士
学位種類 博士(経済学)
学位記番号 博経第145号
研究科 経済学研究科
専攻
論文審査委員 主査: 東京大学 教授 神取,道宏
 東京大学 教授 神谷,和也
 東京大学 助教授 松井,彰彦
 東京大学 助教授 松島,斉
 東京大学 助教授 柳川,範之
内容要旨 要旨を表示する

 この論文は「協調問題」(coordination problem)とそれに対する解決策としての「社会的情報」(social information)について考察するものである。

 通常、「協調問題」とは、他のある均衡に対してパレート劣位にある均衡が存在する状況を指す。それゆえ、協調問題は経済に存在する非効率性を表現する代表的なモデルとなっている。更に、この論文では「協調問題」という用語をより広い意味で用いることにする。すなわち、そもそも均衡が複数存在するために、各経済主体がどの均衡に協調すべきか不明確な状態を、広義の意味での「協調問題」と呼ぶことにする。言い換えれば、広義の協調問題とは「ナッシュ均衡のプレー可能性」(Playability of Nash equilibrium)と深く関わる問題である。

 この論文では、こうした協調問題を回避するための解決法として、経済主体間の社会的情報の伝達活動に着目する。ここで社会的情報とは複数の主体間に共有されている情報と定義する。第2章では、広義の協調問題を解決する上で社会的情報が必要不可欠となるような一般的モデルを構築している。また第3・4章では、社会的情報の中で、特に「評判」(reputation)に関する分析を展開する。

 この要旨の以下の部分では、各章の内容をより具体的に説明する。

 第1章では、前半部分で「協調問題と社会的情報」という主題を巡る概説を行ない、後半部分で以下の章との関連について述べている。

 第2章では、広義の協調問題を解決する上で社会的情報が必要不可欠となるようなモデルを構築している。

 より具体的には、社会の人々が、チューリング・マシーンで表現された行動ルールに従って様々な戦略的状況に対処している状況を想定する。そこにおいて人々の行動ルールに関する学習過程を想定し、その果てに実現する行動ルールの集合を社会的安定条件として定式化する。その結果、人々が「着目点」(focal point)と同様の機能を持つ社会的情報を得られるときのみ、社会的安定性が実現可能であることを示している。

 このモデルにおける社会的安定条件は、人々が広義の協調問題を解決していることを要求するよう定式化されている。すなわち、ナッシュ均衡のプレー可能性が問題となる。ナッシュ均衡のプレー可能性は、「ナッシュ均衡の基礎」(foundation of Nash equilibrium)というリサーチ・プログラムの下、80年代の後半から研究の蓄積がなされている。更に、これらは「エダクティヴな接近法」(eductive approach)と「エヴォルーティヴな接近法」(evolutive approach)とに大別される。

 この章の分析は、「エダクティヴな接近法」の中のBinmore[3]、Anderlini[1]、Canning[4](以下ではBACと総称する)等の分析と関係が深い。BACは合理的な人間の推論過程のモデルとしてチューリング・マシーンを用い、ナッシュ均衡が実現するための条件を調べた。その結果、概してナッシュ均衡をプレーするのは困難であるとの結論を得た。

 これに対し、この章ではチューリング・マシーンを行動ルールのモデルとみなし、学習過程の結果として達成される安定条件を調べる。すなわち、「エヴォルーティヴな接近法」の立場をとる。その結果、一方ではBACと同様、社会的情報の無い状況では社会が安定するのは困難であるという結果が得られる。しかし、人々が「着目点」と同様の機能を持つ社会的情報関数にアクセスでき、それに基づいて均衡選択を行なうような行動ルールに従っているとき、社会全体がナッシュ均衡に協調することができることを示した。

 「着目点」はSchelling[6]によって導入された概念である。Schellingは、たとえ複数均衡に直面したとしても、数学的ゲーム表現で捨象されてしまうような文化的な背景などを駆使することによって、人々はどれか一つの均衡に「着目」し協調することができると主張した。この議論は協調問題を考える上でたいへん重要であるにも関わらず、分析的な研究はほとんどなされてこなかった。この章のモデルは着目点の分析的枠組を提供するものであると考えられる。

 第3章では、無限回繰り返し囚人のディレンマ・ゲームにおいて「評判」が均衡利得を一意にすることを示した。これは「評判」が協調問題を緩和していることを示すものである。

 より具体的には、割引無しの無限回繰り返し囚人のディレンマ・ゲームの両側不完備情報(two-sided incomplete information)ヴァージョンを考察する。Anderlini and Sabourian[2]と同様、プレーヤーのとる戦略を計算可能(computable)なものに制限し、かつ不完備情報による撹乱(perturbation)も計算可能戦略集合上に制限する。このとき、最初に十分大きい撹乱の範囲をとり、その撹乱の確率を均一に小さくしていくと、囚人のディレンマ・ゲームにおける協力利得が唯一の均衡平均利得として残ることを示している。

 これまでに不完備情報ゲームにおける評判の分析は数多くなされている。それらに対し、この章では「模倣法」(mimicking technique)と「消去法」(deleting technique)という新しい分析手法上の分類を強調している。端的に言えば、「模倣法」とは他のタイプの行動を模倣を行なうことに着目する手法であり、「消去法」とは望ましくないタイプであるという可能性を一つ一つ消去して行くことに着目した手法である。

「模倣法」に比べ、「消去法」はある行動を繰り返すようなタイプではなく、ある戦略に従って行動するようなタイプの効果を調べる際に、より使いやすい手法である。しかしながら、「消去法」を編み出したAnderlini and Sabourianでは共通利益ゲーム(common interest game)を分析の対象としているため、その力は十分に発揮されているとは言えない。この章の分析は、戦略コミットメントが本質となる囚人のディレンマ・ゲームの均衡利得の一意性を対象としているので、「消去法」の力をより発揮していると言える。

 またこの章の結果はAnderlini and SabourianとWatson[7]の結果の拡張にもなっている。Anderlini and Sabourianは「消去法」を用いて共通利益ゲームでの一意性定理を示した。これに対し、この章ではこの定理が囚人のディレンマ・ゲームでも成立することを示している。またWatsonは不完備情報の撹乱の範囲を有限記憶戦略(bounded recall strategy)集合に制限したときの囚人のディレンマ・ゲームにおける一意性定理を示した。これに対し、この章では撹乱の範囲をより広い計算可能戦略集合にしても成立することを示している。

 第4章では評判獲得の競争過程を分析している。

 より具体的には、1人の「学習」(learning)するプレーヤーが2人のより高度なプレーヤー(以降「教師」(teacher)と呼ぶ)とランダム・マッチングし、純粋協調ゲームを繰り返しプレーしている状況を想定する。ここでそれぞれの「教師」にとって望ましい協調ゲームの均衡が異なると仮定する。それゆえ各「教師」は「学習」プレーヤーの予想、すなわち「評判」を自分の望ましい均衡の方へ誘導するよう「教育」(teaching)活動を行なう誘引を持つ。こうした「学習」と「教育」の動学過程を分析し、「消耗戦」に似た現象を引き起こす動学的均衡が存在することを示している。

 その動学的均衡においては、「学習」プレーヤーの予想がまだどちらにも偏っていないときには、各「教師」とも「教育」活動を続ける。その間、短期的な協調の失敗が発生している。しかしひとたび「学習」プレーヤーの予想がどちらかの均衡に偏ってしまうや、その均衡が望ましくない「教師」も「教育」を諦めその均衡に協調するようになるのである。

 著者の知る限り、評判獲得の競争過程を分析した研究は皆無である。この章の分析は、より一般的な分析への第1歩となることを企図している。

 また、この章の「消耗戦」は「学習」と「教育」の動学過程から発生していると述べた。これは「消耗戦」の新しい源泉であると言える。例えば、Fudenberg and Tirole[5]では企業の費用に関する不完備情報から「消耗戦」が発生する。しかし、この章の「消耗戦」はなんら物理的な不確実性は必要としないのである。

参考文献

[1] Luca Anderlini. Some notes on church's thesis and the theory of games. Theory and Decision, 29:19-52, 1990.

[2] Luca Anderlini and Hamid Sabourian. Cooperation and effective com- putability Econometrica, 63:1337-1369, 1995.

[3] Ken Binmore. Modeling rational players,part i,ii. Economics and Philosophy, 3,4:179-214, 9-55, 1987/88.

[4] David Canning. Rationality,computability, and nash equilibrium. Econometrica, 60:877-888, 1992.

[5] Drew Fudenberg and Jean Tirole. A theory of exit in duopoly. Econo-metrica, 54:943-960, 1986.

[6] Thomas C. Schelling. The Strategy of Conflict Harvard University Press, Cambridge, Massachusetts, 1960.

[7] Joel Watson Cooperation in the infinitely repeated prisoners' dilemma with perturbations. Games and Economic Behavior, 7:260-285, 1994.

審査要旨 要旨を表示する

1. 本論文は、戦略的状況における協調達成のために、社会的な情報が果たす役割を理論的に研究した3本の研究論文と、全体の展望を示す序章(第1章)からなっている。第一の研究論文(第2章)では、安定な社会の形成において、一定の複雑さを持った社会的情報が重要な役割を果たすことが、計算可能性の理論を使った最近の「手続き合理性」の理論の枠組みで示される。同時にこれは、T・シェリングによって提唱され、その重要性が認められながら理論モデルに取り込むことが困難とみられてきたfocal pointという概念の、一つの定式化としての意味も持つ。続く第3章は、「評判」の確立を通じて社会に協調が達成される経緯を、わずかな確率で特定の行動を取るプレーヤーが存在するくりかえしゲームを使って明らかにする、一連の研究に関連するものである。特に、計算可能な戦略のみを考慮することで、くり返し囚人のジレンマゲームにおいて、協調が必ず達成できるという新しい結果が導かれている。最後の第4章は、二人の対立するプレーヤーが第三者からの「評判」獲得の競争をするモデルを提示している。これは、従来まとまった研究の無かったテーマであり、見通しのよい分析を可能にするモデルの作り方を提示するとともに、「消耗戦」ゲームと共通の性質を均衡が持つことなどが示される。以下では、序章をのぞいた中核部分、第2章から4章のそれぞれの概要を論じ、最後に全体に関する審査結果を記すことにする。

2. 第2章は、安定な社会の形成において、一定の複雑さを持った社会的情報が重要な役割を果たすことを、計算可能性の理論を使った最近の「手続き合理性」の理論の枠組みで示すものである。議論の出発点になるのは、Binmoreらによる、戦略的意思決定を計算可能なものに限定する一連の研究である。人1:知能・計算機理論では、計算可能性をある種の汎用計算機モデル(チューリングマシン)で実行できるものと定式化する。Binmoreらは、戦略的意思決定がこうした意味で計算可能であるとすると、「すべての状況で合理的に振る舞う」ことが困難であることを明らかにした。具体的には、すべてのゲームと、すべての「計算可能な手続きにしたがってゲームをプレーする相手」に対して、相手の出方を正しく読んでそれに最適に反応する計算可能な手続きはないことを彼らは示した。これに対し、著者の着目点は、計算可能なすべてのものを考えるのではなく、その一部からなる社会を考えると、おたがいが常に上手く最適反応をすることが可能になり、上記の不可能性命題を覆すことが出来るのではないかということである。例えば、任意にゲームがあたえられたとき、その特定のナッシュ均衡を常にプレーする人のみからなる社会を考えれば、この事は自明に成り立つようにも見える。しかし著者は、こうした社会にはある種の不安定性があることをまず指摘する。すなわち、「現存する社会のメンバーと当たったときには現存のメンバーのように振る舞うが、新参者と対戦するときは変わったことをする」という新参者の参入が起こり、こうした新参者がすべて入った状態では「お互いが常に最適反応する」ことが、Binmoreらの研究と同様の理由で不可能になることが示される(定理2.1)。つまり、お互いに常に最適に反応することの困難は、ある種の「閉じた」社会を形成しない限り回避できないということである。そこで著者は、この章の中核をなす「社会的情報」の概念を導入する。計算理論では、任意の元がその集合に入っているか否かが前述の意味で計算不可能なものがあることが知られており、こうした計算不可能な情報をoracleと呼んでいるが、著者の定義する社会的情報とは、「社会の成員のみが利用できる計算不可能な情報」のことである。すると、内部者のみがこれを使って複数均衡のあるさまざまなゲームで特定の均衡を歩調を合わせてプレーすることが可能になる一方、外部者はどの均衡戦略を選ぶのが最適反応か計算することが出来ないことになる。したがって、前述のような外部者の侵入による不安定性を回避することが出来るのである(定理2.2)。これは、シェリングのいうfocal pointの一つの定式化であるとともに、その新たな機能をしめす理論であると見ることも出来る。

3. 第3章は、「評判」が協調を達成するメカニズムに関する研究であり、理論的には無限回くり返しゲームにおいて協調が必ず達成できることを、わずかな情報の不完備性を導入することによって説明しようとする一連の研究に対する貢献である。無限回くり返しゲームで協調が達成可能なことはよく知られているが、同時に非効率なさまざまな結果も均衡になってしまうという問題点がある(フォーク定理)。そこで、協調のみが均衡になるような状況の検索が大きな研究課題となってきたが、一つの方法は各人がわずかの確率で必ずしも合理的でない行動をとることを許すというものである。こうした行動を上手く選べば、協調を唯一の均衡として導くことは比較的容易であるが、先行研究は、わずかな確率で取られる行動(「行動タイプ」と呼ぶことにする)をかなり一般的な範囲で取っても、なおかつ協調が唯一の解として導かれることを、特定のゲームについて示してきた。具体的には、Aumann-Sorinがパレート効率点が一点からなる「純粋協調ゲーム」と行動タイプが有限記憶を持つものすべての場合について分析し、Anderlini-Sabourianが同じゲームについて行動タイプが計算可能な広い範囲である場合を扱った。さらに、WatsonはAumannらとおなじ行動タイプをつかって囚人のジレンマで協調のみが達成されることを示した。本章では、残されたケース、すなわち囚人のジレンマで行動タイプが計算可能な広い範囲である場合に同様な結果を導いている。基本的な証明の道筋は、Anderlini-Sabourianに近く、協調しないタイプと異なる行動をとることにより協調する意図を相手に伝えて行くというものである。このとき、計算可能な行動タイプが可算個であるという計算理論の結果が重要な役割をはたしている(協調しないタイプを一つ一つ消して行くことによって、協調するタイプの確率を任意の水準まで上げることができる)。ただし、証明の構成は純粋協調ゲームを扱った彼らのものをかなり修正する必要がある。したがって、著者の証明はこの基本アイデアをより広いゲームに適用する可能性を開くものとして評価できる。

4. 第4章は、二人の対立するプレーヤーが、第三者からの「評判」を獲得するために競争をするモデルを提示している。具体的には、一人のナイーブな学習ルールに従うプレーヤーLが、各期ランダムに、A,Bどちらかのプレーヤーと対戦する状況を考える。プレーされるのはa,b二つの均衡がある単純な(2×2)ゲームで、プレーヤーAは均衡aをbより好み、プレーヤーBは逆である。これに対し、Lについてはどちらの均衡の利得も同じである。さらに、プレーヤーLは過去にどちらの戦略が取られたかを見て、現在の戦略を(対戦相手に依存せずに)決めるような、学習ルールに従うとする。このとき、AとBは、なるべく自らの好む均衡をLが学習するように誘導する誘因を持つ。これは、二つの異なった業界標準を提唱する2企業が、消費者を自社の標準に誘導しようとする状況を単純化したものと見ることも出来る。本章では、こうした状況でのA、Bの均衡行動を見通し良く分析するための工夫をこらしたモデルが提唱され、均衡条件が大幅に単純化されることが示される。こうして得られた均衡は、いわゆる「消耗戦」と共通した性質を持つことが明らかにされる。既存の研究では、ナイーブな学習ルールにしたがう者のみを扱ったものや、単一のプレーヤーや利害が一致したプレーヤーが評判を獲得するものが主体であり、本章で扱ったような、学習するプレーヤーに対して利害の対立した合理的プレーヤーが評判の獲得競争をするというケースは体系的に扱われてこなかった。その意味で、われわれの新しい知見を開くものであると評価できよう。

5. 全体として、著者は経済理論の分析手法と最新の研究動向に対する十分な知識持ち、またここに収められた各論文は最終的に審査つきの学術雑誌に掲載可能な水準に達しているという評価に審査委員全員が達した。また、第2章・3章は滝澤氏との共著になっているが、前者については数学的証明全般に関して、後者では特に論文の中核をなす補題3.2の証明について、著者が十分な貢献をしたことと認められた。各研究に関する審査の概要は以下の通りである。第2章に関しては、計算可能性に関する最新の研究を十分に踏まえた上で、oracleという概念を経済学ではじめて導入し、併せてシェリングの古典的な概念に再解釈を与えた点で、著者の独創性が強く出ているとの評価がなされた。一方で、計算可能でない社会的知識とは何に対応するのか、またこれがどのような過程で利用可能になるのかという解釈面でやや不明確さがあるという指摘も出された。第3章に関しては、先行研究の結果を一歩前進させる意味のある貢献をなすものと評価された。これに対しては、より広い範囲のゲームに関しても同様な結果を導くような拡張が可能ではないかとの示唆が出された。第4章に関しては、評判の獲得競争という新しいアイデアを定式化したことが評価された。これに関しては、評判の獲得を争うプレーヤーに強弱の差があるケースへの拡張が示唆された。以上のようにいくつかの要望・示唆が出されたが、全体として学位申請論文としての要件を十分に満たしており、博士(経済学)の学位授与に値するものとの結論に、審査委員全員が一致して到達した。

UTokyo Repositoryリンク