学位論文要旨



No 213139
著者(漢字) 吉浦,裕
著者(英字)
著者(カナ) ヨシウラ,ヒロシ
標題(和) 不完全表現からの意味の復元モデルを用いた理解方式の研究
標題(洋) Machine Understanding Using Meaning Restoration Models of Incomplete Expressions
報告番号 213139
報告番号 乙13139
学位授与日 1997.01.20
学位種別 論文博士
学位種類 博士(理学)
学位記番号 第13139号
研究科
専攻
論文審査委員 主査: 東京大学 教授 平木,敬
 東京大学 教授 辻井,潤一
 東京大学 教授 益田,隆司
 東京大学 教授 萩谷,昌己
 東京大学 講師 品川,嘉久
内容要旨 1.序論

 計算機が工場やオフィスの日常業務に組み込まれるに従い、その操作の容易化がますます重要になっている。計算機操作の容易化のための一方法として、図面や自然言語などの人間にとって日常的な情報伝達手段を用いた計算機への情報伝達が考えられる。そのためには、計算機による理解機能、すなわち図面や自然言語の表す情報を推定し、それを計算機処理に適した形式で表現する機能が必要である。

 図面や自然言語は、記述の対象に関する知識、製図規則や文法規則、文脈的知識など多種多様な知識を前提として情報を伝えるので、理解機能の実現には、これらの知識の利用が必要となる。そこで、理解機能のための知識処理方式が1960年代から数多く提案されてきた。しかし、実用的な問題においては対象とする知識が複雑かつ多量なため、従来方式の多くが利用できず、その結果、実現可能な理解機能は限定されていた。特に、図面や自然言語の本質的な特徴である入力情報の不完全性すなわち省略及び曖昧性への対処が不十分であった。

 本論文では、複雑かつ多量の知識を必要とするため実用性の乏しかった従来の知識処理方式を改良し、少量の知識のみで入力情報の不完全性に対処することが可能な、理解のための知識処理方式を論ずる。以下では、まず、従来方式を分析し、次に、その問題点を解決する新方式を提案する。最後に、機械部品の三次元形状入力のための三面図の理解、及びワードプロセッサーの操作法を教授する質問応答システムにおける自然言語質問文の理解というタイプの異なる二つの実問題への適用を通じて、提案方式の有効性を明らかにする。

2.従来の理解のための知識処理方式

 以下では、特定の問題下で図面や自然言語の表す情報を、その問題における認識対象と呼ぶことにする。また、認識対象の種類と種類毎の性質を明確化することを認識対象のモデル化と呼び、そこで明確化された知識(認識対象の種類と性質)を認識対象モデルと呼ぶことにする。従来の理解のための知識処理方式を、認識対象モデルの利用に関して分類すると以下のようになる。

(1)トップダウン処理

 問題に固有の認識対象モデルを用いて、初めに入力データの表す情報を予想する。次にその予想の正当性を、入力データの解析により検証する。

(2)ボトムアップ処理

 問題に依存しない一般的な知識を用いて、入力データから抽出可能な情報を網羅的に抽出し、その結果の組合せにより入力データの表す情報を推定する。問題固有の認識対象モデルは用いない。

(3)トップダウン処理とボトムアップ処理の併用

 両方式の併用により、入力データの表す情報を推定する。

 以下では、上記の分類に沿って、従来方式の問題点を述べる。

 まず、機械部品三面図の理解を考える。従来のトップダウン処理は、パラメタライズされた機械部品の三次元形状を認識対象モデルとし、その写像と図面のマッチングにより部品の形状を認識していた。しかし、現実には、部品の種類が多く、かつ、その形状が複雑なため、認織対象のモデル化が困難であった。一方、従来のボトムアップ処理では、二次元の図形要素と三次元の図形要素の対応関係に関する一般的な幾何学の知識を用いて、図面に一致する三次元図形要素の組合せを求めていた。ところが実図面では、円柱形の穴のような単純形状部分の記述は省略されることが多い。従って、一般的な幾何学の知識だけでは、不完全な二次元形状から三次元形状を復元することは不可能であり、省略に対処できなかった。また、従来のトップダウン処理とボトムアップ処理の併用方式では、機械部品のうち形状の単純な部分については、上述した三次元の認識対象モデルを使用し、形状が複雑でモデル化が困難な残りの部分については、一般的な幾何学の知識を用いて認識していた。しかし、この併用方式は処理効率を向上させるために両方式を組み合わせただけで、それぞれの欠点は未解決であり、記述の省略へは依然として対処できなかった。

 次に、質問応答システムの自然言語理解を考える。従来のトップダウン処理では、入力文は数種類しかないコマンドのいずれかを表すと想定し、コマンドのテンプレートと入力文のマッチングにより文の意味を認識していた。このコマンドのテンプレートが認識対象モデルである。ところが、ほとんどの実用的質問応答システムでは、入力文の表す意味は多種多様であるため、数種類のコマンドに帰着することはできず、認識対象のモデル化が困難であった。また、従来のボトムアップ処理では、文法や単語の意味に関する一般的な知識を用いて入力文を解析していたが、一般的な文法及び意味の知識だけでは、自然言語によく現れる意味の曖昧性に対処できなかった。また、従来のトップダウン処理とボトムアップ処理の併用方式は、図面の場合と同様に効率向上だけを目的とするもので、各々の問題は未解決のままであるので、曖昧性には対処できなかった。

 従来方式の問題点をまとめると以下のようになる。トップダウン処理は、機械部品三面図の理解や質問応答システムの自然言語理解に代表される実用的な理解の問題においては、認識対象が複雑なため、そのモデル化が困難であり利用できない。一方、ボトムアップ処理は、図面や自然言語の本質的な特徴である入力情報の不完全性すなわち省略及び曖昧性に対処できない。また、トップダウン処理とボトムアップ処理の併用方式は、上記入力情報の不完全性への対処を目的としていないため、依然、その問題は未解決である。

 すなわち、従来のいずれの方式も、実用的な理解の問題において入力情報の不完全性に対処することはできなかった。

3.不完全表現の解釈モデルを用いた理解のための知識処理方式

 本論文では、入力情報の不完全性への対処に適したトップダウン処理とボトムアップ処理の新しい併用方式として、省略及び曖昧表現の対象となる情報のモデル化と、そのモデルを用いたトップダウン処理の、ボトムアップ処理への埋め込みから成る方式を提案する。以下では、その方式の有効性を論ずる。

(1)省略及び曖昧表現の性質

 三面図とは、本来、機械部品の形状を人と人との間で正確に伝えるための手段であり、省略は、人の正確な理解を妨げない範囲でのみ使われる。省略された二次元形状から人が三次元形状を正確に推定するには、一般的な幾何学の知識だけでなく、省略された機械部品の形状に関する知識も必要となる。換言すると、省略可能な部分は、人が形状を予想できる部分に限定されている。以上から、「三面図において省略表現の表す形状は限定されている」という仮説を立て、その検証のため実際の三面図120例を分析した。その結果、省略表現の表す部分は穴、ネジ受けなどに限定されていて、その形状も、円柱や直方体など数種類しかないことが判明した。

 次に自然言語文を考察する。自然言語文の中には、正確な情報伝達を目的としないものもあるが、ワードプロセッサー操作の質問文のように目的が明確な質問文の場合、曖昧表現の使用は、人の正確な理解を妨げない範囲に限られている。換言すると、その曖昧表現は、人が意味を予想できる範囲内でのみ用いられる。以上から、「正確な情報伝達を目的とする自然言語質問文においては、曖昧表現の表す意味は限定されている」という仮説を立て、その検証のために実際の質問文を分析した。その結果、自然言語質問文で使われる曖昧表現の意味は数種類に限定されていることが判明した。

 上記の分析結果から、「人間の情報伝達手段が正確な情報伝達を目的として使用される場合には、省略及び曖昧表現の表す情報は限定されており、従ってモデル化が可能である」と考えた。

(2)方式提案

 上記の考察から、次のような、理解のための知識処理方式を提案する。

 (a)省略及び曖昧表現の表す情報をモデル化する。そして、そのモデルを、個々の問題において、省略及び曖昧表現の表す情報を予想するために利用する。本論文では、このモデルを、不完全表現の解釈モデルと呼ぶ。

 (b)一般的知識を用いたボトムアップ処理を基本とし、その処理過程で入力情報の不完全性を検出したときに、上記(a)の不完全表現の解釈モデルを用いたトップダウン処理を実行し当該部分を理解する。

 従来は、省略及び曖昧表現の存在を想定しないで複雑な認識対象をモデル化しようとし困難を生じていた。しかし、複雑な認識対象であっても、省略及び曖昧表現との関係に着目すれば、部分的なモデル化が可能となる。そこで、本方式を用いることにより、従来は認識対象のモデル化が困難であった問題においても、部分的なモデル化が可能となり、不完全な入力情報から意味を復元することが可能になる。

4.適用例

 上記の提案方式に基づく三面図及び自然言語質問文の理解方式を具体的に論ずる。

 まず、三面図からの機械部品三次元形状の認識方法を論ずる。ここで不完全表現の解釈モデルとなるものは、記述の省略される、穴、ネジ受け、突起などの形状である。本方式では、三つの異なる写像方向を持つ図面から幾何学的知識を用いた組合せ計算(ボトムアップ処理)により三次元形状を復元することを基本とするが、その過程において記述の省略を検出したときに、不完全表現の解釈モデルを用いたトップダウン処理を実行し、省略部分の形状を推定する。

 本方式の有効性は実図面を用いた評価によって確認できた。また、従来、省略部分の処理は自動化が困難であったが、本方式により自動化が可能となった。本論文では、図面における省略の割合と本方式の計算量の関係も明らかにした。

 次に、ワードプロセッサーの操作法を教授する質問応答システムにおける自然言語質問文の意味解析方式を論ずる。上記質問応答システムでは、同じ質問文であっても、文脈に応じて具体的質問を表したり、一般的質問を表したり、その一般性のレベルは多岐に渡っている。例えば「図を動かすには?」という質問文においては、画面上の特定の図を移動するための具体的方法を質問している可能性もあれば、あるいは、図の一般的な移動方法を質問している可能性もある。システムは質問文の意味に応じて回答を変える必要があるが、そのためには、まず上述したような、質問文の持つ一般性のレベルに関する曖昧性を解消する必要がある。

 上記質問文の意味の曖昧性は、文中の自立語(名詞、動詞、形容詞など、それ自体で意味を持つ単語)の意味の曖昧性に帰着する。そこで、自立語の意味を、具体的な一つの事物を表す場合、複数の具体的な事物の集合を表す場合、不特定の一つの事物を表す場合というように、その一般性の程度に依って分類し、その分類を不完全表現の解釈モデルとした。本方式では、文法や語彙の知識を用いた文の解析(ボトムアップ処理)を基本とし、その過程において意味の曖昧性を検出したときに、不完全表現の解釈モデルを用いたトップダウン処理を実行して、自立語の意味を決定する。ワードプロセッサの操作法を教授する質問応答システムの実現及び評価を通じて、実際の質問文において意味の曖昧性が正しく解消できることを示した。このような質問応答システムにおいて、従来、具体的質問と一般的質問の識別はできなかったが、本方式の導入によりその識別が可能となり、利用者の意図に沿った回答を返すことができるようになった。

5.結論

 本論文では、省略及び曖昧表現の対象となる情報のモデル化と、そのモデルを用いたトップダウン処理の、ボトムアップ処理への埋め込みから成る、理解のための知識処理方式を提案した。三面図及び自然言語質問文の理解に本方式を適用し、その有効性を明らかにするとともに、三面図の理解において、本方式の有効性を評価する枠組を確立した。本方式は、理解における表現と知識の本質的な相補関係に基づくものであり、情報伝達における理解の本質の解明の手掛りとなりうるものである。

審査要旨

 本論文は6つの章からなる。第1章は序論であり、本論文の研究に向うにあたっての動機となった背景について論じている。本論文では、計算機の操作の容易化を目的として、図面や自然言語など人間にとって日常的な情報伝達手段の計算機による理解を取り上げている。計算機による理解のためには、入力情報の不完全性すなわち省略及び曖昧性への対処、及び、計算量の組合せ的増大への対処が必要である。この課題の解決には、問題固有の対象モデルの利用が必要であるが、実用的な問題において、それは必ずしも成功していない。本論文では、その原因として、実問題では対象が複雑なため、対象モデルの作成が困難であること、及び、対象モデルの利用方式が未確立であることを主張している。そして、実問題での利用に耐えるモデルの作成及び利用方式の確立を研究の主題に設定している。この主題の設定は、学位論文の主題として十分、かつ、妥当であると認められる。

 第2章は、従来の理解方式を、(1)問題に依存しない一般的知識を用いるボトムアップ処理、(2)問題に固有の対象モデルを用いるトップダウン処理、(3)両者の併用、の3種類に分類して、概観し分析している。そして、各々の問題点として、ボトムアップ処理では、入力情報の不完全性及び計算量の組合せ的増大に対処不可能なこと、トップダウン処理では、問題毎の対象モデル作成が困難であること、両者の併用では、一般的な知識と問題固有の対象モデルの切り分け及び連動の方式が未確立であること、を挙げている。さらに、従来のいずれの方式も、実用的な理解の問題において入力情報の不完全性及び計算量の増大に対処不可能であることを論じている。

 第3章は、上記の問題を解決するための、トップダウン処理とボトムアップ処理の新しい併用方式を提案している。最初に、正確な情報伝達を目的とする場合には、省略及び曖昧表現の表す対象は限定されていることを論じ、「対象が複雑でモデルが作成困難な場合でも、省略及び曖昧表現の表す部分についてはモデルの作成が可能である」という仮説を立てている。この仮説に基づいて、(a)省略及び曖昧表現の表す対象のモデル化による問題固有モデルの作成、(b)このモデルを用いたトップダウン処理の、一般的知識を用いたボトムアップ処理への埋め込みからなる理解方式を提案している。さらに、提案方式により、一般的知識と問題固有モデルとのモジュラリティ達成を通じてモデルの作成が容易化できること、問題固有モデルを用いて入力情報の不完全性及び計算量の増大に対処できること、を論じている。

 第4章は、上記提案した方式の三面図理解への適用を述べている。記述の省略された三面図から機械部品三次元形状を復元するため、省略表現の表す形状をモデル化し、このモデルを用いたトップダウン処理の、幾何学知識を用いたボトムアップ処理への埋め込みからなる方式を提案している。また、本方式の利用によりモデル作成が容易化できること、従来困難であった省略部分の処理の自動化が可能になり、計算量が削減できることを実証している。

 第5章は、上記提案した方式の、質問応答システムにおける自然言語理解への適用を述べている。意味の曖昧な自然言語質問文を解釈するため、曖昧表現の表す意味をモデル化し、このモデルを用いたトップダウン処理の、言語知識を用いたボトムアップ処理への埋め込みから成る方式を提案している。また、この方式の利用によりモデル作成が容易化できること、従来困難であった自立語の意味の曖昧性解消が可能になることを実証すると共に、計算量削減の可能性を示唆している。

 第6章は、論文全体の内容をまとめ、今後の研究課題について論じている。特に、提案した方式が理解における表現と知識の本質的な相補関係に基づくものであり、情報伝達における理解の本質の解明の手掛りとなりうることを述べている。

 対象の複雑性と入力情報の不完全性の両者に対処し、計算量を削減することは、本質的に困難な課題であるが、多くの実問題において必須の要件と言える。従来方式は、この課題が解決困難か、あるいは解決できても個別の問題毎に膨大なモデル作成が必要で適用範囲が限られていた。本学位論文は、表現と知識の本質的な相補関係の考察に基づいて、省略及び曖昧表現に着目した部分的なモデル作成を可能にし、課題を解決する新しい理解方式を提案、実証している。その結果、従来方式の限界を打破し、計算機理解の適用範囲を拡大するための基礎を確立した。以上のように、本論文は理解の研究において他に類を見ない優れた研究であり、極めて有意義な成果を得ている。この点で本論文は高く評価され、審査委員全員で博士(理学)の学位の授与にふさわしいと判断した。

 なお、本論文の内容の一部は共著論文として印刷公表済みであるが、論文提出者が主体となって研究及び開発を行ったもので、論文提出者の寄与は十分であると判断する。

UTokyo Repositoryリンク