学位論文要旨



No 116724
著者(漢字) 猪狩,一郎
著者(英字)
著者(カナ) イガリ,イチロウ
標題(和) 言語と談話の複雑さに関する数理的研究 : 力学系によるアプローチ
標題(洋) Numerical Studies of Language and Discourse Complexity : A Dynamical Systems Approach
報告番号 116724
報告番号 甲16724
学位授与日 2001.12.21
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博総合第335号
研究科
専攻
論文審査委員 主査: 東京大学 助教授 池上,高志
 東京大学 教授 金子,邦彦
 東京大学 助教授 西村,義樹
 東京大学 助教授 谷,淳
 統計数理研究所 助教授 泰地,真弘人
内容要旨 要旨を表示する

 本研究では、言語によるコミュニケーションを、二体のエージェント間の談話として、コンピュータシミュレーションにより数理的に扱う。

 自然言語を伴う現象が数限りなくある中で、我々が談話に着目するのは、これが単文の解析に帰着しきれない現象だからである。一般に、自然言語のうち数理的解析に相性が良いのは、生成文法でいう言語能力の領域であるとされている。本研究は、言語能力と言語運用の両方にまたがっている談話という現象を、構成論的にモデル化し、この抽象モデルを通じてその数理的構造を見出そうというものである。

 ここで構成論的というとき、言語でコミュニケートする一般的なマルチ・エージェントモデルに対する批判的な主張が含まれている。これら言語によるコミュニケーションに利得表が与えられているようなモデル(ゲーム論的枠組)においては、言語システムとエージェントが自己組織的に共進化する、というシナリオを描くことが多いが、進化の方向はまず例外なく、系全体を複雑化するドライヴィング・フォース、すなわち利得表の作り方に暗黙のうちに埋め込まれている。また、このようなモデルの多くで、言語はエージェントの中に在る、「あること」を表現するための単なる伝達プロトコルとして形式化されている。このような枠組においては、「伝達事項がうまく互いに理解できること」に高い得点を与えて進化させれば、なるべく同一のプロトコルをもつ、均一な集団ができあがってそれが安定な固定点となるのは明らかである。そこで我々は、談話プロセスに「プロトコルのすりあわせ」以外の意味があることを表現するために、第三者的な談話の成功/不成功を得点付けしないで発話し合う、抽象的な数理モデルを提案する。

 モデル化にあたっては、各エージェントはダイナミカル・レコグナイザーと呼ばれる、シンプルなリカレント・ニューラルネットワークによって構成する。ダイナミカル・レコグナイザー単体では時系列入力の中の構造を学習でき、有限オートマトンを模倣するような学習が可能であることが既に知られている。

 このエージェント(ダイナミカル・レコグナイザー)を独立に二体用意し、談話プロセスを無限ループさせる。エージェントAにとっての一回の談話ステップは、次のようなプロセスから成る。

 1.エージェントAが(自分の発話と相手の発話を結合させた形で)過去の発話列の一部を学習する。これは談話を自分なりにモデル化するということである

 2.次の発話用に、上のモデルを使って、"smoothness principle"になるべくよく従うような発話を選ぶため、全ての発話候補について計算を行う

 3.発話する

 以上のプロセスをエージェントA、Bが同時に行い、また始めに戻って無限ループするものとする。

 我々のモデルでは、「何を発話すればよいのか」ということに関して、エージェントの上のレベルにあって客観的な評価をするメカニズムが組み込まれていない。そのかわり、上記プロセス2にある"smoothness principle"なる原理を天下り的に導入する。この原理に従って発話候補の「望ましい」度合を計算するのだが、その計算は「自分だけの談話のモデル」のみに基づいている点が大変重要な所である。いわば、エージェントは自分の思い込み(自前のモデル)に従って次の発話を選ぶのである。

 発話候補は、簡単化のため6種類のアルファベットから成る(baa)(dii)(guu)のようなユニットチャンク4個の組合せの中から選ぶという制限を設け、2種類のsmoothness principleについて談話のダイナミクスを数値シミュレーションにより分析した。

 特に、「現在学習されているモデルに最も適合する発話を選ぶ」というsmoothness principleを適用したときについては、発話時にランダムノイズが付随する場合も併せて調べた。このとき、発話パターンの安定性と、安定相から不安定相への移りかわりの機構を、ネットワークのコンテクストノードの状態と、発話候補のエラー構造とから特徴づけることができる。

Figure 1:コンテクストプロット。

雲状から島状にネットワーク構造が変化している

審査要旨 要旨を表示する

 学位論文として提出された猪狩一郎氏の博士論文は、言語の新しい数理モデルを提唱解析することを目的とし、具体的にはお互いに発話(ビットストリング)を交わす2つのニューラルネットの相互作用モデルのシミュレーション実験という手法で解析したものである。

 本論文は全4章から成っている。第1章では、論文提出者の言語観および言語理解のための数理モデルに関して、簡単なサーベイと問題点を指摘している。特にコミュニケーションを力学系としてとらえる必要性が議論されている。これに続く2つの章で、著者は2つの可能なモデルを紹介している。最後の4章で全体のまとめと今後の研究の方向が書かれている。

 第2章では、まず動的認識システムという再帰的な結合をもつニューラルネットワークを紹介している。2人の話者はこのネットワークを使って、それぞれ自分の参与している談話の発話モデルをつくりあげ、発話する。談話のモデルは、話者の過去の会話パターンを模倣するように学習により決定されていく。話者の次の発話は、学習された談話のモデルをもとにその連続性から計算される。

 シミュレーションの結果、発話のパターンの時間変化が、学習される談話のモデルの構造の変化によって説明された。談話のモデルは、有限オートマトンとして対応づけられる場合と、より複雑なアルゴリズムとして対応つけられる場合におおまかに分けられ、後者の場合を介して発話のパターンが変遷していくことが示された。この時間変遷の様子を、相互情報量をもちいて定量化している。

 第3章では、同じモデル化の方針にのとって、より力学系的な面が調べられている。2章でのモデルと同様にニューラルネットワークを相互作用させるモデルを扱う。ただし発話の基準を、構成された学習モデルの予測値に近いものを選ぶとし、また発話しあうパターンを単純化することで、パラメター空間でどのような談話のダイナミクスのアトラクターがあるか、が解析されている。その結果、アトラクターとしては、固定点、周期3と6以外に周期的にならないアトラクターや49など長い周期が出現することが分かった。これらのアトラクターの挙動を新しい定量化の仕組みを導入することで解析している。その結果、談話のモデルがより過去の発話パターンに敏感な談話のモデルを構成している場合ほど、発話のパターンはゆらぎやすく単純な周期には落ちにくいことが分かった。また自分の発話から相手の発話への遷移部分の学習を強調することで、談話のアトラクターが単純な周期解に落ちにくくなることを示した。

 第4章は全体の総括であり、「オープンエンド」という視点から談話の時間発展のモデルを捉え直していこうという論文提出者の姿勢が伺われる。本論文は、話者の意図や談話のトピックスの変遷というものを、あらかじめ話者の内部に与えるのではなくて、話者が談話のモデルをつくり会話を進行させる中で、後づけ的に生まれるものだということを構成論的な視点から主張するものである。2章と3章で扱われたモデルは、2つのネットワーク系の相互作用というモデルをもとに、それを議論したものである。談話のダイナミクスを数理モデルとして提起した研究報告はほとんどなく、これを基礎として今後の研究の発展が期待されるものである。

 以上、当博士論文の研究は、十分に独創的なものであり、談話と言語の構造を今後考えていく際に、基本となるひとつの新しい考え方の道筋を指し示したといえるだろう。第4章の最後にも触れられているように、チューリングテストの力学系モデルとの関連も含め、コミュニケーションの力学系研究の発展として十分に期待できる。

 本論文で挙げられた結果のうち、第2は言語の進化国際会議(2000年、パリ)で報告されており、第3章は、論文として専門誌(biosystems)に投稿準備中である。

 以上のように論文提出者の研究は、相互作用をもととした言語の理解に関して重要な寄与をなしていると考えられる。これらの点から本論文は博士(学術)の学位請求論文として合格と認められる、と審査委員会は全員一致で判定した。

UTokyo Repositoryリンク