学位論文要旨



No 122804
著者(漢字) 小野,真裕
著者(英字)
著者(カナ) オノ,マサヒロ
標題(和) 空間構造上の協力行動に関するエージェントベースモデル
標題(洋)
報告番号 122804
報告番号 甲22804
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(情報理工学)
学位記番号 博情第134号
研究科 情報理工学系研究科
専攻 電子情報学専攻
論文審査委員 主査: 東京大学 教授 伊庭,斉志
 東京大学 教授 石塚,満
 東京大学 教授 浅見,徹
 東京大学 教授 近山,隆
 東京大学 教授 坂井,修二
 東京大学 助教授 佐藤,洋一
内容要旨 要旨を表示する

 科学の歴史において,デカルトの「方法序説」に始まる要素還元主義の影響は非常に大きい.要素還元主義とは全体を細かく分割しその構成要素を観察しつくせば全体も理解することができるという方法論である.この方法論に従った物理学や化学などはここ数世紀において大きく発展してきた.

 しかし,全体が全ての要素を単純に足し合わせたものであるという前提は必ずしも正しくない.その例としてよく挙げられるのは,生命や知能である.一つ一つの原子,一つ一つの細胞を観察しても,生命や知能の源となるものは発見できないが,全体としては一個の生命や知能ができあがっている.

 それに対し,複雑系科学と総称される研究領域が近年登場した.機械論的,決定論的でありながら,要素還元主義では説明が難しい現象を解明しようという試みである.この研究領域で議論の中心の一つとなっているものは,創発と呼ばれる現象である.創発とは,多数の要素が含まれる系において,それら要素間の相互作用が,要素それぞれからでは説明できない全体としての振る舞いを生み出す現象を指す.比喩的に言えば,要素間が線形的な関係であれば要素還元主義に沿い予測が可能であるのに対し,非線形的な関係では要素間の相互作用の考慮が不可欠となり創発現象は予測困難であることが特徴でなる.この考え方は計算機シミュレーションを強力な武器とし,計算機の発展と共に近年盛んになってきている.

 世の中の一般的なシステムに共通する性質を知ることは,理学的な意味においても工学的な意味においても非常に重要である.本研究の根底には,創発現象の根本の法則を見出したい,という目的がある.しかしながら,現在のところ一足飛びにこの目的を達成することは困難であるため,一つの具体的な領域に限定し,その限定された現象から知見を得,最終的には一般システムへの適用を目指したい.

 本研究では,空間構造上における意思決定主体間の協力行動,という事例を取り上げ,集団としての協力行動という創発現象に対する知見を得ることを目的とする.本研究ではこの目的に対して,構成論的アプローチをとる.構成論的アプローチとは,多数の要素からなる一つの系をつくり,ミクロなルールに従う多数の要素を実際に動作させ,それらを観察することによってマクロな創発現象に対する理解を深める,というものである.

 具体的には,系の要素としては意思決定を行うエージェントを想定し,進化的なマルチエージェント・シミュレーションを行う.エージェントは,意思決定を数理的に扱うゲーム理論におけるゲームの一つである,囚人のジレンマ・ゲームを他のエージェントとプレイする.本研究の特徴として挙げられるのは,エージェント同士の接触を限定する空間構造という概念を導入している点である.ゲームをプレイする対戦相手のエージェントは,空間構造により決定される.空間構造は,近年研究の盛んなネットワーク・モデルを利用しており,そのノードとしてエージェントは存在する.

 エージェントの意思決定は相互に影響を及ぼし合い,集団としての特性もそれらエージェントの意思決定が積み重なって生じる.そこで,エージェントの振る舞い,エージェント集団の性質といったものを観察し,創発現象に関する知見を得ることを試みる.また,本研究では新たなエージェント・モデルを提案することにより,空間構造がエージェントの学習に及ぼす影響や,相手の意図の推定能力の有用性を考察することが可能となる.

 以上のような背景・目的を踏まえ,本研究は以下の構成をとっている.

 第一章では,本研究の背景および目的を述べる.これまで伝統的であった要素還元的な手法ではなく構成論的な手法の必要性を論じ,本研究では構成論的アプローチに従い,論を進めることを宣言している.

 第二章では,ゲームとは何か,また関連する領域の中でどのような位置づけとなるかを説明している.本研究に関連する内容に関しては,これまで異なる分野においてそれぞれ研究がなされてきている.例えば,社会的にどのような場合にどのようなゲームが発生するか,慣習や道徳が歴史的にどのような経緯を経ているか,それらを整理することによって本研究の目的がより明確になる.関連分野の説明とそれらを統合したパースペクティブの提案,およびその中での本研究の位置づけを述べる.

 第三章では,空間構造上において囚人のジレンマ・ゲームをプレイするエージェント集団の基礎的な振る舞いを調べる.プレーヤーは,過去一回のゲームの記憶を持ち,刺激‐反射モデルに従う一次のメタ戦略をとる.計算機シミュレーションを行い集団を進化させて,エージェントの振る舞いや集団の特性を観察する.これまで生態学の分野で確認されていた,各生物種のランクと個体数の関係はべき乗に従うという現象を確認した.解析的,数値的に既に示されている単純なマトリクスによる進化実験だけではなく,ゲームを行うエージェントにおいても同様の現象が発生することがわかった.

 第四章では,ゲームと連動して空間構造が変化する場合について調べる.エージェント間の接続をエージェントが操作可能であるとき,集団の規模を一定とした場合と集団が成長する場合について,空間構造が変化する様子をシミュレーション実験によって確かめた.どちらの場合においても,実世界において観察されるようなネットワークのように特定のエージェントへの集中が見られる.

 第五章では,ゲームをプレイする新たなエージェント・モデルを提案し,空間構造が学習にあたえる影響を調べた.エージェントは強化学習を行い,ゲームの過程で自分の戦略を変化させることができる.そのため進化の過程において学習パラメータを観察することで,空間構造がエージェントの学習に与える影響を調査する.実験により,エージェント間の関係性が強くなれば将来の報酬を期待し協力しやすくなることがわかった.これは社会学における信頼と集団の流動性の関係に関する知見を支持するような結果である.

 第六章では,集団の制御可能性について検討する.工学的,社会工学的な応用を考える場合には,集団の特性を何らかの方法で望ましい状態に導くような技術が必要である.しかしながら,そもそも結果の予測が困難な複雑な系においては,そのような要件を満たす決定的な手法は存在しない.ここではゲームととらえて定性的な議論を行い,考えうる方法を整理する.次に,空間構造を利用した制御方法を提案し,実験によりその効果を調べる.その結果,集団の多様性とのトレードオフがあるものの,ある程度空間構造に偏りがある場合には効果があることが確認された.

 第七章では,他エージェントの意図を推測しゲームを行うエージェントを提案し,その効果を調べる.人類は他者の心を推測し,それも考慮に入れた上で自らの行動を決定する.その機構は社会的なゲームにおいては非常に重要であると考えられる.そこでその効果の重要性を定量的に評価した.対戦相手のエージェントの戦略を推定し,後方帰納法に基づき最も利得の得られる行動を選択するモデルを提案し,実験によりその効果を確かめた.その結果,反射的なモデル,学習するモデルと比較して著しく協力する可能性が高いことがわかった.

 最後に第八章では,本論文をまとめ今後の課題について言及する.本研究では先述の目的に従い,空間構造上における協力行動を観察することにより,創発的な現象に関する知見を得ようと試みた.多主体意思決定環境においては,ある意思決定主体は他の意思決定主体から影響を受けるが,特に空間構造によってその影響の具合が異なること,集団の相互協力の度合いが異なることがわかった.また,複数の主体の意思決定モデルを提案し,それぞれについてその機能の効果を確認した.その結果,学習は協力の弊害になりうること,他のエージェントの戦略の推測は非常に有益であること,がわかった.

審査要旨 要旨を表示する

 本論文は「空間構造上の協力行動に関するエージェントベースモデル」と題し,8章から成る.

 第1章「序論」では,空間構造上で関係を持つことになる意思決定主体(エージェント)間の協力行動を取り上げ,集団としての協力行動という創発現象に関し,これまで伝統的であった要素還元的なアプローチでなく構成論的な手法の必要性を論じるという,本研究の立場を述べている.

 第2章「個体・集団の意思決定」では,ゲームとは何か,また関連する領域でどのような位置付けとなるかを説明している.本研究に関連する内容に関しては,これまで幾つかの分野で研究がなされてきているが,それらを整理して上で,統合的なパースペクティブを示し,本研究を位置付けている.

 第3章「ネットワーク形式」では,空間構造上において囚人のジレンマ・ゲームをプレイするエージェント集団の基本的な振る舞いを調べている.ここで,プレイヤーは過去1回のゲームの記憶を持ち,刺激-反射モデルに従う1次のメタ戦略を取る.コンピュータ・シミュレーションを行い,エージェント集団を進化させて,その振る舞いや特性を観察し,これまで生態学分野で確認されていた各生物種のランクと個体数の関係はべき乗に従うという現象を確認している.

 第4章「ネットワーク形式」では,ゲームと連動して関係の空間構造が変化する場合について調べている.エージェント間の接続をエージェントが操作可能である時,集団規模を一定とした場合と集団が成長する場合について,空間構造が変化する様子をシミュレーションにより確かめ,どちらの場合も実世界で観察されるようなネットワークのように,特定のエージェントへの集中が生じることを示している.

 第5章「空間構造の学習への影響」では,ゲームをプレイする新たなエージェント・モデルを提案し,空間構造が学習に与える影響を調べている.このエージェントは強化学習を行い,ゲームの過程で自己の戦略を変化させることができる.進化の過程で学習パラメータを観察することで,エージェント間の関係性が強くなれば将来の報酬を期待し協力しやすくなることを示している.これは社会学における信頼と集団の流動性の関係に関する知見を支持する結果となっている.

 第6章は「集団の制御可能性」である.工学的,社会工学的な応用を考える場合には,集団の特性を何らかの方法で,望ましい状態に導くような技術が必要であるが,結果の予測が困難で複雑な系においては,そのような要件を充たす決定的な手法は存在しない.ここではこの状況をゲームととらえて考え得る方法を整理し,次いで空間構造を利用した制御方法を提案し,実験を通してその効果を調べている.その結果,集団の多様性とトレードオフがあるものの,ある程度空間構造に偏りがある場合には有効性があることを示している.

 第7章「他者意図の推定」では,他エージェントの意図を推測しゲームを行うエージェントを提案し,その効果を定量的に評価している.対戦相手エージェントの戦略を推定する場合には,後方帰納法に基づき最も利得の得られる行動を選択するモデルと比較し,著しく協力する可能性が高まることを示している.

 第8章「結論」では,本論文をまとめ,今後の課題について述べている.

 以上を要するに,本論文は空間構造上で関係を持つ意思決定主体(エージェント)間の集団としての協力行動の創発について,これまで伝統的であった要素還元的なアプローチでなく,マルチエージェントによるコンピュータ・シミュレーションを用いる構成論的なアプローチから論じている.そして,多主体意思決定環境においてはある意思決定主体であるエージェントは他のエージェントから影響を受けるが,特に空間構造によってその影響の様相が異なること,集団の相互協力の度合いが異なることなどの知見が得られたことを示している.また,複数エージェントの意思決定モデルを提案し,関係の空間構造は学習プロセスへ影響を与えること,他のエージェントの戦略の推測は協力関係を達成するのに非常に有益であることの知見を示している.これらはマルチエージェント・システムにおいてエージェントの集団行動を扱う際に有用となる知見を与えており,電子情報学上貢献するところが少なくない.

 よって本論文は博士(情報理工学)の学位論文として合格と認められる.

UTokyo Repositoryリンク http://hdl.handle.net/2261/25844