学位論文要旨



No 213233
著者(漢字) 津田,宏
著者(英字) Tsuda,Hiroshi
著者(カナ) ツダ,ヒロシ
標題(和) 論理プログラムに基づく制約ベースの自然言語解析
標題(洋) Studies on Logic Programming Language for Constraint-based Natural Language Analysis
報告番号 213233
報告番号 乙13233
学位授与日 1997.03.10
学位種別 論文博士
学位種類 博士(理学)
学位記番号 第13233号
研究科
専攻
論文審査委員 主査: 東京大学 教授 萩谷,昌己
 東京大学 教授 辻井,潤一
 東京大学 教授 高木,利久
 大阪大学 助教授 郡司,隆男
 京都大学 助教授 横田,一正
内容要旨

 本論文では、cu-PrologとQuixoteという制約に基づく論理プログラム言語を提唱し、それらの有効性を自然言語解析への応用において示す。

 cu-Prologは論理プログラムの一つであるPrologをベースとして、その一部を制約として記述し処理を行なうことのできる言語である。Quixoteでは、さらにオブジェクト指向の性質を加え、概念の上下関係に相当する包摂関係を扱うことができる。これらのプログラム言語では、対象とする問題の手続き的な部分をルールにより、また宣言的な部分を制約により記述し、前者については固定した推論手順で、後者については制約解消により処理を行なうことができる。

 これらの応用としては自然言語解析を取り上げる。自然言語解析は、構文解析のような手続き的な処理とともに、時制の一致のように制約による宣言的な情報の処理が必要となる問題領域である。従来は、形態素解析、構文解析、意味解析といったレベルの処理モジュールを線形に固定してつなげて行なうことが多かったが、それではモジュールにまたがる制約の解析が困難であった。

 これに対して、cu-PrologやQuixoteの応用として実現されるのは制約ベースの自然言語解析である。制約により各レベルの情報を統一的に宣言的に記述し、主な処理は制約解消により行う。制約は情報を部分的に規定するため、自然言語の曖昧性や状況依存性を取り扱うのに適している。また、宣言的な記述と処理とを分けることで、例えば解析と生成のように流れる情報の方向が異なっても、処理の部分を変更するだけで対応することができる。

 制約ベースの自然言語解析を実現するための、言語学的な枠組としては、制約ベース文法(Constraint-based Grammar)を採用する。これは、一般的な句構造を骨格として、データ構造には素性と値の対を不定個並べた素性構造(Feature Structure)を持ち、文法情報の大半は素性構造の間の制約により宣言的に記述される。1980年代よりHPSG(Head-driven Phrase Structure Grammar)やJPSG(Japanese PSG)などが提唱されている。

 制約ベース文法の計算機処理においては、素性構造の取り扱い、および制約として宣言的に与えられる情報をいかに自然に記述し、句構造の処理と合わせて効率良く処理するかが求められる。本論文で述べられる研究成果は次のとおりである。

 1.Prolog述語による制約をドメインとする制約論理プログラム言語cu-Prologの理論的定式化を与え、その実装について述べる。

 2.cu-Prologの応用として、以下の制約ベースの自然言語処理について述べる。

 (a)選言的素性構造の単一化

 (b)JPSGに基づく日本語パーザ

 (c)制約解消に基づくCFGパーザ

 3.オブジェクト指向の特徴を持ち、包摂関係に基づく制約をドメインとする、知識表現言語Quixoteの理論的定式化を与え、その実装について述べる。

 4.Quixoteによる、以下の制約ベース文法の処理への応用について述べる。

 (a)型付き素性構造のQuixoteによる取り扱い

 (b)「AのB」という日本語表現のJPSGによる意味論および語用論のQuixoteによる取り扱い

 以下、これらの概略について述べる。

1.cu-Prolog

 宣言的なプログラム言語として、論理プログラムのPrologが取り上げられることが多い。しかし、Prologでは、節の処理順序がAND,OR方向ともに固定されているため、プログラムを記述した時点で、処理の順序も固定してしまうことになる。これは、自然言語の制約処理のように、制約の処理順序があらかじめ規定できないような問題への適応には問題となる。

 cu-Prologは、Prologのホーン節を拡張して、節の一部を制約として記述した制約ホーン節(Constrained Horn Clause:CHC)を基本構造とする制約論理プログラムである。

 

 BiおよびCiはPrologの原子式である。Bnまでは通常のPrologと同じ固定した順序で処理される。制約部分のC1,C2,…,Cmは、Prolog部分の処理に連動して、依存性のある部分だけが制約解消系により処理される。制約解消には、プログラム変換の手法として知られるunfold/fold変換を用いている。

 また、cu-Prologはデータ構造としてPST(Partially Specified Term)を採用している。PSTは、制約ベース文法における素性構造と同様に、素性と値の対を不定個取ることのできるデータ構造である。PSTは部分的に分かっている情報を記述するのに適している。cu-Prologでは、PSTに制約を付加した制約付きPSTにより、単に素性の値が存在するか否かだけでなく、素性の取り得る値の範囲を指定したり、複数の素性の値の組合せを記述することができる。

2.cu-Prologの制約ベース文法への応用

 cu-Prologによる制約ベースの自然言語解析への応用として、本論文では以下の3つを取り上げる。

 最初の応用は、選言的素性構造(Disjunctive Feature Structure)である。これは、素性構造に選言(OR)を取り入れたもので、自然言語の曖昧性の記述において重要な役割を果たす。これまで選言的素性構造としてValue Disjunction,General Disjunction,Disjunction Namesなどが個別に提案されている。cu-Prologにおいては、これらを全て制約付きPSTとして統一的に記述することが可能である。また、選言的素性構造の単一化は、PSTの単一化および依存する制約の解消というcu-Prologの通常の処理に相当する。そのため、選言性を処理する特別な枠組は不要である。選言的素性構造の単一化では、選言性を組合せ的に爆発させない実用的な手続きがいくつか提唱されている。cu-Prologにおいては、依存する制約のみが解消され、fold変換による変換履歴の利用とともに効率的な処理が可能であることを示した。

 第2の応用はJPSGに基づく日本語の構文解析である。制約ベースの自然言語解析では、構文木作成の手続きと、素性間の制約の処理とが連動して行なわれる。このJPSGパーザでは、CHCのProlog部分で骨格となる句構造の処理を行い、制約部分でJPSGの素性構造間の制約の処理を行う。さらに、辞書に制約を付加することで、多義語による曖昧性も扱うことができることも示した。いずれの制約もcu-Prologの制約解消により統一的に処理され、曖昧性解消のプロセスは制約解消により自動的に実現される。本論文には、cu-Prologの処理系(cu-Prolog III)による、JPSGパーザのプログラムを付録として添付した。

 第3は制約解消の実験的な応用として、cu-Prologの制約解消系のみを使い、CFG(Context Free Grammar)の構文解析を行う。第2の応用であるJPSGパーザでは、構文木作成はProlog部分で既存の解析アルゴリズムで行なっていために、制約として統一的に木構造の曖昧性を扱うことはできなかった。本応用においては、構文木の処理をも制約処理で行なった。さらに、fold変換で制約解消履歴を使うことで、Earleyのアルゴリズムと同等の効率の計算量で処理を行うことができることを示した。

3.Quixote

 制約論理プログラム言語Quixoteでは、論理プログラムに制約だけでなくオブジェクト指向の概念を導入することで、知識表現言語としての記述力が増している。

 まず、Quixoteでは、オブジェクトおよびその属性の指定を基本的なデータ構造としている。そのため、cu-PrologにおけるPSTは、オブジェクトおよびその属性により表現される。さらに、オブジェクトの間に包摂関係を導入し、属性の継承を行なうことで効率的な表現が可能となる。

 Quixoteが取り扱う制約は、主として包摂関係である。これは、cu-Prologのような組み合わせ制約とは異なり、概念の上下関係(ISAまたはA-KIND-OF)に相当する。包摂関係は項書換えに基づく制約解消系で処理される。

 さらにQuixoteではモジュール概念を入れることで、ルールや属性をモジュール(状況)毎に分割して記述することができる。これにより、一見矛盾するような知識も、異なったモジュールにより表現できる。Quixoteのルールは、PrologのSLDを拡張したOLDT推論規則により処理され、cu-Prologと同様にそれと連動して制約解消系が制約の処理を行なう。

 本論文では、筆者が中心となって研究を行なったQuixoteの制約の定式化や実装手法に重点をおいて述べる。

4.Quixoteの制約ベース文法への応用

 Quixoteの制約ベース文法への応用としては、意味論および語用論といった、cu-Prologの応用より上位レベルの処理が適している。本論文では、以下の2つの応用について述べる。

 最初の応用として、型付き素性構造(Typed Feature Structure)を取り上げる。これは、包摂関係を持つ型を素性構造に与えたデータ構造である。Quixoteオブジェクトの属性表現と型付き素性構造の関係を論じた。

 応用の第2は、JPSGの意味論の記述である。ここでは、日本語の「AのB」(A,Bはそれぞれ名詞句)という表現を取り上げ、その意味的/語用論的解釈の記述をQuixoteにより行なった。「AのB」という表現は、自然言語解析において、意味論的には曖昧性が大きく、解釈の状況依存性が高い例として知られる。まず、日本語の名詞句のうち、固有名詞および普通名詞の解釈をQuixoteの制約およびモジュールにより記述した。次に「の」の解釈を与えて、名詞句との組合せで「AのB」の表現全体の解釈をJPSGに基づき構成した。そして、Quixoteにおいて3通りの表現に大別できることを示し、あわせてその分類の手続きも示した。

審査要旨

 本論文の主要な部分は四つの章から成り立っている。第三章ではcu-Prologと呼ぶ制約論理プログラム言語、第四章ではcu-Prologを用いた自然言語解析、第五章では知識表現言語Quixote、第六章ではQuixoteを用いた自然言語解析について述べられている。

 本論文では、cu-PrologとQuixoteという制約に基づく論理プログラム言語を提唱し、それらの有効性を自然言語解析への応用において示す。

 cu-Prologは論理プログラムの一つであるPrologをベースとして、その一部を制約として記述し処理を行なうことのできる言語である。Quixoteでは、さらにオブジェクト指向の性質を加え、概念の上下関係に相当する包摂関係を扱うことができる。これらのプログラム言語では、対象とする問題の手続き的な部分をルールにより、また宣言的な部分を制約により記述し、前者については固定した推論手順で、後者については制約解消により処理を行なうことができる。

 これらの応用としては自然言語解析を取り上げる。自然言語解析は、構文解析のような手続き的な処理とともに、時制の一致のように制約による宣言的な情報の処理が必要となる問題領域である。従来は、形態素解析、構文解析、意味解析といったレベルの処理モジュールを線形に固定してつなげて行なうことが多かったが、それではモジュールにまたがる制約の解析が困難であった。

 これに対して、cu-PrologやQuixoteの応用として実現されるのは制約ベースの自然言語解析である。制約により各レベルの情報を統一的に宣言的に記述し、主な処理は制約解消により行う。制約は情報を部分的に規定するため、自然言語の曖昧性や状況依存性を取り扱うのに適している。また、宣言的な記述と処理とを分けることで、例えば解析と生成のように流れる情報の方向が異なっても、処理の部分を変更するだけで対応することができる。

 制約ベースの自然言語解析を実現するための、言語学的な枠組としては、制約ベース文法(Constraint-based Grammar)を採用する。これは、一般的な句構造を骨格として、データ構造には素性と値の対を不定個並べた素性構造(Feature Structure)を持ち、文法情報の大半は素性構造の間の制約により宣言的に記述される。1980年代よりHPSG(Head-driven Phrase Structure Grammar)やJPSG(Japanese PSG)などが提唱されている。

 制約ベース文法の計算機処理においては、素性構造の取り扱い、および制約として宣言的に与えられる情報をいかに自然に記述し、句構造の処理と合わせて効率良く処理するかが求められる。本論文で述べられる研究成果は次のとおりである。

 1.Prolog述語による制約をドメインとする制約論理プログラム言語cu-Prologの理論的定式化を与え、その実装について述べる。

 2.cu-Prologの応用として、以下の制約ベースの自然言語処理について述べる。

 (a)選言的素性構造の単一化

 (b)JPSGに基づく日本語パーザ

 (c)制約解消に基づくCFGパーザ

 3.オブジェクト指向の特徴を持ち、包摂関係に基づく制約をドメインとする、知識表現言語Quixoteの理論的定式化を与え、その実装について述べる。

 4.Quixoteによる、以下の制約ベース文法の処理への応用について述べる。

 (a)型付き素性構造のQuixoteによる取り扱い

 (b)「AのB」という日本語表現のJPSGによる意味論および語用論のQuixoteによる取り扱い

 なお、本論文は、橋田浩一氏、白井英俊氏、横田一正氏、原田康也氏との共同研究であるが、論文提出者が主体となって分析及び検証を行ったもので、論文提出者の寄与が十分であると判断する。

 したがって、博士(理学)を授与できると認める。

UTokyo Repositoryリンク http://hdl.handle.net/2261/50689