学位論文要旨



No 212079
著者(漢字) 三浦,孝夫
著者(英字)
著者(カナ) ミウラ,タカオ
標題(和) 複合オブジェクトを用いたデータモデリングの論理アプローチ
標題(洋) Logic Approach to Data Modelling using Complex Objects
報告番号 212079
報告番号 乙12079
学位授与日 1995.01.26
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第12079号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 教授 大須賀,節雄
 東京大学 教授 田中,英彦
 東京大学 教授 武市,正人
 東京大学 助教授 堀,浩一
 東京大学 助教授 喜連川,優
内容要旨

 高度な情報システムの実現においてはモデル構築がキーポイントとなる技術であり、その核になるのが知識処理・データベース処理である。本研究の目的は、このモデル構築をより高度に支援するため、データベース概念を見直し基礎を確立することにある。このような応用は、設計や意志決定など、予め定まった解の存在しない非決定的な問題で数多く見いだすことがでできる。

 モデル構築のためのデータベース機能という観点から考察すれば、現状のデータベース技術の最大の問題は、データベース技術にモデル構築を(計算機で)支援することの意識が希薄な点にある。情報を記述する処理、起述された情報の操作を行う処理について終始しており、情報記述に至るステップを意識していない。従って、現状のデータベース技術に対しては情報の認識手法に関してどの様な可能性があるかが明らかにはならない。

 本来データベース技術は次のような前提、即ちデータベースパラダイム(枠組み)を基礎として成り立つ:

 (1)データベースシステムの基本機能は問題領域独立である。

 (2)事前に分類された大量の情報を扱う。

 (3)記述された枠組みを遵守し操作の結果の無矛盾性を保証する。

 (4)構文と解釈を分離し、データ操作の意図を宣言的に記述する。

 データベースパラダイムは、ビジネスデータ処理を中心とする定型的な業務に対して効果的に作用した。しかし、モデル構築支援を行うときには次のような障害となってしまう:

 (1)分類基準を事前に決定せねばならない

 (2)問題領域と独立に用意した基本概念を組み合わせる表現しか得られず、時として利用者に概念変換を課さねばならない。

 (3)分類基準の変更はデータベース構築の前提の変更となる。

 (4)分類基準の変更はスキーマの修正を意味し、データ操作記述を変更せねば成らない。

 これを克服するための基礎技術は、計算可能なデータモデル、データベース進化支援、複合オブジェクト定義の柔構造化、データ操作の柔構造化にある。

 モデル構築の要(かなめ)は、モデル表現手法をいかに確立するかにある。概念変換をなるべく少なく行うためには、対象指向、即ちモデル化される対象を直接実体(entity)としてコード化するというアプローチに基づき、しかも計算可能なデータモデルとなる必要がある。宣言性および操作性を保証するために構成的な記号を用いたデータモデル概念が確立されるべきであり、論理にもとづいたアプローチが最も妥当である。

 本研究では、データモデルAISを定義し、いわゆる意味データモデルの導入を行う。AIS(Associative Information Structure)データモデルは典型的な実体指向データモデルであり、実体・型、連想・述語・ISAなどの概念に基づいて構築されている。データ論理は、第1階多類述語論理を拡弘したものであるが、記号は静的には型付けられていない。このため1つの実体が同時に複数の実体型を有するというAISデータモデルの特性を反映させることができる。実体に対応して定数項が、連想には基礎原子式が対応する。前提となる分類基準は、個別情報および情報関連に対応して型、述語として記述される。データ構造を構成する方法を持つ。このことで、解釈方法によらずに、データ構造自体が持つ意味を構文上で操作できる。データ構造を特定する手法として、データ論理では定数と構造項を特殊な組として扱う。AISデータベース実現値はデータ論理の意味(解釈)として定義される。このことでデータモデルとデータ論理の対応が図られる。

 モデル構築を支援するためには、データベーススキーマを自動的に操作する必要がある。これは論理的な観点からは推論操作を意味しており、データ操作の高機能化(部品展開など)や高度なプログラム独立の達成(アクセス経路の推定など)とともに計算可能なデータモデルの必要性を示すものである。推論機構が完全であるならば、データモデル操作と論理処理が必要且つ十分に対応し、自動的なモデル操作を行うに十分の根拠を与える。また計算手法と捉えれば、演繹情報の計算、無矛盾性の検証、冗長あるいは等価な表現の検出などが可能となる。データ論理は構造項および関数項を有しており、1階論理の枠組みを越えた機能を有するが、完全な導出現理機構を設定することができる。即ち、データ論理はこのような役割を担うに十分な機能を備えた論理である。

 高度意志決定支援を必要とするモデル構築では、いくつかの情報から構成された情報が独立した情報となることが数多く発生する。このようなデータ表現問題は、’複合オブジェクト’と呼ばれる。複合オブジェクトを記述するため、これまでNF2関係モデルなどでもび究されているが、集合とレコードを用いたデータ構造だけを扱うことになり、特定のデータ構造に依存した情報だけを扱うという問題を生む。これを解決するため問題となる点は、複合オブジェクト記述を柔構造化するための方法は何か、つまりデータ構造とその操作を動的・宣言的に定義することができるかということにある。

 AISデータモデル及びデータ論理では、柔構造複合オブジェクトの実現のための手法を定義できる。構造値を生成するために不動点演算による演繹機能を用いる。この構築に部分関数を利用者が定義するとする。実体集合の構成だけを演繹的に定義し、しかも操作をその枠組みで整合させるきわめて一般的な手法を用いる。この方法で記述できるものには、リスト、木など再帰型の構造値の他、集合や多重集合も含まれる(つまり組み込み構造型は、記述効率の観点からAISモデルで用意されていると捉えることができる)。またデータ論理では、データ操作の柔構造化に対応するため、データ構造の関数定義を宣言的に行える。ここには、主要なリスト操作関数や集合操作が含まれる。

 一旦構築されたモデルは、分析評価され、モデルの精密化・分割・代替化などの修正がなされる。この間、データベースは絶え間ない変化・進化を繰り返す。この過程は’データの進化’と’スキーマの進化’に分けられる。前者は、データを時間軸に沿って管理する機能(設計内容が異なるので情報内容が異なる)ことを表し、後者は情報表現の多様性を支援するためスキーマ(型・述語)の生成・削除・合併・分解など意味する。モデル修正は設計過程の本質的な行為であるため、きわめて高い頻度で発生する操作である。しかし、スキーマ進化の都度、大量のデータをすべて自動的に変更すると考えるのは現実的でない。意志決定を繰り返しながら漸近的になされるモデル進化に対応して、増分的なスキーマ進化とデータの自動変更を行う方が現実の姿に近いと考えられる。この考察から、スキーマ進化を支援するために次のような機能が実現できる:

 (1)増分的スキーマ進化を支援する

 (2)スキーマ進化操作の完全性:進化によって意図するデータ変更が発生すると同時に、意図するデータ変更がスキーマ進化で表現できるものでなけれなならない。

 実際に提案されるスキーマ進化操作は、大きく言って型操作(実体集合のブール集合と対応する)、述語操作(第1階述語論理の枠内での変換)、複合型(木、集合操作に関する操作と対応する)からなる。

 モデル構築においては、データは(プロセスを経ないで)直接操作される対象である。このとき、柔構造化されたデータベースに対して柔軟な機能を提供するもので無ければならない。高度なプログラム独立性を達成する為には、データ操作言語にたいして大きく二つの方向性が要求される。データ操作の具体化をデータベースシステムが自動的に選択するものでなければならない。このような宣言性は、大部分が論理的な推論手順によって達成される。第2の方向性は、示された経路は利用者が検証できるものでなければならない点にある。スキーマが常に変化する環境にデータ操作言語が追随するべきである。

 データ論理は完全な導出現理を有するが、データベースでは効率を特に重視するため、推論機能の効率化も重要な意味を持つ。本研究では、ホーン節プログラムの形式を用い、前提部に否定を含む形を許す様な処理の論理に広げて、効率向上の技法を示す。ここでは論理プログラムの解探索空間を減少させるための新たな技法として変数の取る値を集合化する方式を取る。この変数値自体がさらに構造値でこの変数値自体がさらに構造値であってもよい。初めに、プログラムに出現する事実や規則を集合項によって非正規化する。このとき極小モデル(確定節だけならば最小モデル)の対応がある。本手法はクラスタ化の基礎を与えている。粒度の大きな集合を操作単位とするため、データベースアクセス技法が効果的に作用することが期待できる。

 第2の側面に関して、モデル構築の過程では、情報・惰報構造を直接操作し、その結果利用の方法を決定しまたモデルを修正する。このようなデータ操作言語は実体指向データモデルと対応している。そのため実体概念や複合オブジェクトを支援するもので無ければならない。データベースが、(操作の)宣言性を失うことなくプログラム独立を達成するためには、論理型言託か図形言語(またはその混合)以外に選択はない。論理を用いれば、意図・機能の正確な記述が得られるが、抽象度に応じて細部を隠すことが難しい。図形言語では、スキーマダイアグラムをガイダンスとして質問を構成することが可能であり、意図を確認しやすい。反面、同じ記号が混乱して用いられ、言語としての表現力が不明である。本研究では図形言語PIMを定義する。PIMでは質問テンプレートの単位はスキーマダイアグラムに対応する。PIMがデータ論理の部分クラスと等価である。また、特に限量技法、即ち、否定や全称限量のための記述を含む。このことから、AISデータモデルの計算可能性という特徴を失うことなく図形言語としてのデータ操作機能を達成することができる。

 以上を要するに、高度情報システムの達成は、モデル構築がどの程度まで高度に処理できるかにかかっている。さらに、モデルの記述と操作は、情報システムの核となるデータベース技術でどの様に扱われるかという点に、大きく依存する。本研究では、モデル構築を支援するためのデータベースの核技術、つまりデータモデルを与える段階から考察した。計算可能な枠組みを有するデータモデルAIS(とデータ論理)に対して、柔構造複合オブジェクト、データベーススキーマ進化、図形に基ずくデータ操作言語PIMを検討した。これらの考察の結果から、提案する機能を備えることで、モデル構築のステップにデータベースが大きな貢献をなし得ることが明らかになった。

審査要旨

 理学士三浦孝夫の提出論文は、’複合オブジェクトを用いたデータモデリングの論理アプローチ’と題し、10章からなる。

 高度な情報システムの実現においてはモデル構築がキーポイントとなる技術であり、その核になるのが知識処理・データベース処理である。本研究の目的は、このモデル構築をより高度に支援するため、データベース概念を見直し、基礎を確立することにある。このような応用は、設計や意志決定など、予め定まった解の存在しない非決定的な問題で数多く見いだすことができる。

 モデル構築のためのデータベース機能という観点から考察すれば、現状のデータベース技術の最大の問題は、データベース技術にモデル構築を(計算機で)支援することの意識が希薄な点にある。情報を記述する処理、記述された情報の操作を行う処理について終始しており、情報記述に至るステップを意識していない。これを克服するための基礎技術は、計算可能なデータモデル、データベース進化支援、複合オブジェクト定義の柔構造化、データ操作の柔構造化にある。

 第1章は序論であり、本研究で扱う問題の定義と解決策を要約している。

 第2章では、本研究の基礎となる複合オブジェクトと論理的基礎に関連する研究概要をまとめている。ここでは、複合オブジェクトとくに非正規関係モデルに関する要約、データモデルの論理による形式化の研究を中心に関連研究を要約している。

 第3章では、データ論理の定義と理論的な特徴付けを行っている。データ論理は多類論理を型付けの強化と構造項によって拡張したもので、意味データモデルAISの持つ基本概念とそれに開連する概念を形式的に記述している。複合オブジェクトは、定数と構造項を結び付ける特殊な述語で表現し、実体と複合値の組と解釈している。

 第4章では、データ論理上で定義される導出原理について述べている。この定理自動証明機能は、健全かつ完全な推論となる。このことから、データ論理がデータモデルの操作を自動化するに十分の理由を与えるものとなることが述べられている。さらに、構造項を持つ論理プログラムや演えき繹データベースの新たな基礎となる。

 第5章はデータクラスタ化の観点からの論理処理効率に関する議論を考察している。プログラムに集合構造を導入し、等価な集合型論理プログラムを得ることができる。このことで、解の探索空間を減少する。空間の粒度が大きくなるため、データベース技法が直接利用でき、大幅な性能向上が期待できる。

 第6章では、複合オブジェクトの柔構造化に関する理論的考察について論究している。任意の構成による(一般的な)複合オブジェクトについて記述している。抽象データ型(ADT)の形式化手法を用いて、演繹閉包の概念を導入し、複合オブジェクトの記述および操作の定義に関する考察を行っている。

 第7章及び続く第8章では、視覚操作に基づくデータ操作のための図形言語PIMについて言及している。これはAISデータモデルの代数言語として位置付けられ、データ論理と等価な表現力を有することを証明している。このことから、PIMは複合オブジェクトの視覚操作を行うだけでなく、意味データモデルのためのデータ操作言語として十分な機能を有するものであることが述べられている。

 第9章では、スキーマの柔構造化を直接扱うスキーマ進化支援について論究している。型進化、述語進化、複合型の進化が考察されており、それぞれの進化に対して実現値も変更する操作を導入し、変換の意図と実際の操作が一致するのに充分な表現力を有することが述べられている。

 最後の章は、本研究の結論である。さらに今後研究すべき問題についても論じている。

 以上を要するに、高度情報システムの達成は、モデル構築がどの程度まで高度に処理できるかにかかっており、モデルの記述と操作は、情報システムの核となるデータベース技術でどの様に扱われるかという点に、大きく依存する。本研究は、モデル構築を支援するためのデータベースの核技術、つまりデータモデルを与える段階から考察したものであり、新しい工学的基礎を形成するものである。このような技術は、知識工学などには不可欠のものと考えられ、その成果はデータベース分野のみならず、知識工学を通して工学全般に寄与するところが大きい。よって本論文は、博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク