学位論文要旨



No 215154
著者(漢字) 池田,哲夫
著者(英字)
著者(カナ) イケダ,テツオ
標題(和) 異種データベースシステムの連携技術に関する研究
標題(洋)
報告番号 215154
報告番号 乙15154
学位授与日 2001.09.20
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第15154号
研究科 工学系研究科
専攻 電子情報工学専攻
論文審査委員 主査: 東京大学 教授 安田,浩
 東京大学 教授 石塚,満
 東京大学 教授 西田,豊明
 東京大学 教授 喜連川,優
 東京大学 教授 山口,和紀
 東京大学 教授 堀,浩一
内容要旨 要旨を表示する

 データベース技術の発展・普及に伴い,既存の複数のデータベースシステムを連携して利用したいという要求が生じている.

 ここで,既存の,互いに異種性を有する(即ち,データモデル,データ項目の値の表現形式などが同一とは限らない)データベースシステムを連携して利用する形態の代表的なものに,(1)基幹業務の効率化などを狙いとして基幹系データベースシステムの仮想的な連携を実現する連邦データベースシステムと,(2)データ入力稼動削減,組織内を流れる情報の速度の向上などを狙いとして基幹系データベースシステム間で直接的にデータを交換することにより連携を実現する企業アプリケーション統合と,(3)的確な意志決定を可能にすることを狙いとして基幹系データベースシステムからデータを抽出して構築される意志決定支援用のデータベースシステムであるデータウェアハウスとの3つがある(図1).本研究では,各形態において重要と認識されている以下の問題点を研究課題として設定している.

・ 連邦データベースシステムにおけるスキーマの構築方式

・ 企業アプリケーション統合におけるデータ交換システムの構築方式

・ データウェアハウスにおけるオンラインデータローダの高速化方式

 第1の研究課題(連邦データベースシステムにおけるスキーマ構築方式)に関して,研究内容を説明する.

 スキーマとは,連邦データベースシステムに関する定義情報を言う.具体的には,連邦データベースシステム中のデータの構造,連邦データベースシステム中の実体・データ項目と基幹系データベースシステム中の実体・データ項目との対応関係,連邦データベースシステム中の各種の整合性制約,などからなる.

 従来の研究においては,スキーマの構築稼動が大きいという問題があった.

 この問題を解決するため,(1)実体レベルの作業を簡易化することを狙いに,関係データベースにおける質問の簡易化のために導入された概念である普遍関係を採用することと,(2)データ項目間の関連特定作業を簡易化することを狙いに,用語辞書を用いて類似データ項目の分類を支援する機能を備えることとを主な特徴とするスキーマ構築方式を提案している.

 提案方式を実現する連邦データベース検索システムDBSENA (DataBase SEmantic NAvigation system)を作成し,さらにDBSENAを用いて複数データベースシステムを連携するシステムを試作し,提案方式の有効性を評価した.

 提案方式の特徴を有しないスキーマ構築方式(実体レベルの構築作業を含み,類似データ項目の分類支援機能を有しない構築方式)を用いて構築した場合と構築稼動の比較を行った(図2).比較の結果,構築稼動が約4割削減されたことが判明し,提案方式は構築簡易化に有効であることが確認された.

 提案方式の適用領域に関しては,以下に記す広い適用領域を有することを示した.

・ 企業が情報資源管理(情報を企業経営資源の一つとみなして,その完全性を維持し,有効利用を図ること.情報資源管理の方法論の一部に用語の統制やデータ項目名の標準化などが含まれる)を実施しており,スキーマのデータ項目名の集合を各データ項目の意味が容易に理解可能なように構築できる場合の,総データ項目数が約200程度までのスキーマの構築.

・ (スキーマのデータ項目名の集合を各データ項目の意味が容易に理解可能なように構築できるか否かに関わらず),総データ項目数が数十程度までのスキーマの構築.

 第2の研究課題(企業アプリケーション統合におけるデータ交換システムの構築方式)に関して,研究内容を説明する.

 データ交換システムとは,基幹系のデータベースシステム間での直接的なデータ交換を実現するシステムを言う.従来より存在する,(1)業務として定常的にデータ交換を行なうシステム,(2)情報システム更改時用のデータ移行システム,(3)データ複製システム,などを包括する概念である.

 データ交換システムの構築において,交換先データベースシステムの自律性(レガシーシステムであり既存機能の改造が困難である,など)に起因して,交換先の既存データ入力インタフェースを改造無しに利用する制約などの,交換先への影響を極小化する制約を課された環境が考えられる.従来の研究においては,この環境を含む様々な環境向けのデータ交換システムを,少ない稼動で構築可能とする構築方式の研究は無かった.

 この問題を解決するため,(1)様々な環境向けのデータ交換に必要な機能の明確化を狙いに,データ交換処理モデルを提案し,(2)構築簡易化を狙いに,データ交換処理モデルに沿った,データ交換システムの開発・実行環境を提案している.

 データ交換処理モデルは,データと機能との形式的なモデルの考案と,それに基づく操作機能の導出とを特徴とする.

 データ交換システム開発・実行環境は,生成方式を適用すること,即ち,データ交換の仕様を簡易に記述できる高水準仕様記述言語を備えることと,基本的な操作機能およびデータ項目値変換関数をソフトウェア部品として備えることとを特徴とする.

 データ交換システム開発・実行環境の実装(DB-STREAMと呼ぶ)を行い,さらにDB-STREAMを用いて複数データベースシステム間のデータ交換システムを試作し,データ交換処理モデルおよびデータ交換システム開発・実行環境の有効性を評価した.

 交換先データベースシステムの既存データ入力インタフェースを改造無しに利用するデータ交換システムが構築でき,データ交換処理モデルは交換先への影響の極小化に有効であることが確認された.

 データ交換システム構築稼動に関しては,個別プログラミングによって構築した場合と構築稼動の比較を行った(図3).比較の結果,構築稼動が約6割削減されたことが判明し,データ交換システム開発・実行環境は構築簡易化に有効であることが確認された.

 提案した開発・実行環境の適用領域に関しては,(1)既存データ入力インタフェースを改造無しに利用するなどの,交換先への影響を極小化する制約を課された環境でのデータ交換システムの構築が適用領域となることと,(2)前記制約を課されない環境でのデータ交換システムの構築においても,適用対象のシステムで必要な機能の多寡に依存して,提案した開発・実行環境が最適となりうるケースが少なからぬ割合で存在することとを示した.

 第3の研究課題(データウェアハウスにおけるオンラインデータローダの高速化方式)に関して,研究内容を説明する.

 データローダとは,基幹系データベースシステムからデータを抽出してデータウェアハウスに該データをロードするシステムを言う.基幹系データベースシステムの大量のデータを検索することを特徴とする.データローダは,少量のデータの検索・更新を行なう通常のトランザクションとは非同期にロードを行なうオフラインデータローダと,トランザクション技術を用いて,通常のトランザクションと同期してロードを行なうオンラインデータローダとに大別される.

 従来の研究においては,通常のトランザクションと,オンラインデータローダ用の大量の検索を行うトランザクション(大量検索型グローバルトランザクションと呼ぶ)が共存する環境における,高性能なトランザクション同期制御方式が確立していなかった.特に,ミッションクリティカルなものが多数存在する通常のトランザクションの高性能な実行を可能とする同期制御方式が確立していなかった.

 この問題を解決するため,トランザクションが検索専用の場合は,同期制御に起因する副作用が小さい(アボートは一切発生せず,他のトランザクションとの間で待ちが発生するのはREADの実行時に,未完了のトランザクションによって作成された版を選択しそのトランザクションの完了を待つ場合のみ)という特長を持つ方式として多版時刻印方式があることに着目し,該方式と同期制御方式の主流である2相ロック方式とをベースに新たな方式を提案している.提案した方式は以下の特徴を有する.

・ 通常のトランザクションのREAD/WRITEの制御には2相ロック方式を修正適用する.

・ 大量検索型グローバルトランザクションのREADの制御には多版時刻印方式を修正適用する.

・ 大量検索型グローバルトランザクションのWRITESET(トランザクションでの更新対象テーブルの和)に関して,大量検索型グローバルトランザクションを他のトランザクションと直列に実行させる.

 提案方式の性能に関して,従来方式(2相ロック方式)の性能との比較をシミュレーションによって行なった(図4).比較の結果,通常のトランザクションの性能(スループット)は提案方式の方が大幅に(最大約3倍)良いことが判明し,提案方式は,通常のトランザクションと大量検索型グローバルトランザクションとが共存する環境における優れた同期制御方式であることが確認された.

 提案方式の適用領域に関しては,遅延の少ない意志決定支援を可能にすることを狙いに,オフラインデータローダではなくオンラインデータローダが構築されるケースが少なからぬ割合で存在すること,従って提案方式が一定の適用領域を有することを示した.

 以上を要するに,本論文では,異種データベースシステムを連携して利用可能とする技術を確立するために,種々の重要な問題の解決方式の提案を行い,稼動データあるいは性能シミュレーションデータの定量的な比較により,それらの提案方式の有効性を確認した.さらに,それらの提案方式が広い適用領域を有することを示した.

図1.異種データベースシステムの連携の形態

図2.スキーマ構築稼動の比較

図3.データ交換システム開発稼働の比較

図4.同期制御方式の性能の比較

審査要旨 要旨を表示する

 本論文は、「異種データベースシステムの連携技術に関する研究」と題し、既存の複数の非均質な(即ち、データモデル、データ項目の値の表現形式などが異なる)データベースシステムを連携して利用する技術を研究した結果をまとめたものである。研究にあたっては、従来の連携技術における問題点を解決するための方式を提案し、その方式の有効性を、定量的な作業量データあるいは性能シミュレーションデータの比較により、評価している。それらの結果は、以下の5章にまとめられている。

 第1章は「序論」であり、本研究の背景および研究課題と、本論文の構成とについて述べている。異種データベースシステムを連携する形態の代表的なものに、(1)基幹業務の効率化などを狙いとして、基幹系データベースシステムの仮想的な連携を実現する、連邦データベースシステムと、(2)データ入力作業量削減、組織内を流れる情報の速度の向上などを狙いとして、基幹系データベースシステム間で直接的にデータを交換することにより、連携を実現する企業間アプリケーション統合と、(3)的確な意志決定を可能にすることを狙いとして、基幹系データベースシステムからデータを抽出して構築される、意志決定支援用のデータベースシステムであるデータウェアハウスとの3つがある。本研究では、各形態において重要と認識されている問題点を、研究課題として設定している。

 第2章は「連邦データベースシステムにおけるスキーマ構築方式」と題し、連邦データベースシステムのスキーマに関して、その構築方式を提案している。スキーマとは、(1)連邦データベースシステム中のデータの構造、(2)連邦データベースシステム中の実体・データ項目と、基幹系データベースシステム中の実体・データ項目との対応関係、(3)連邦データベースシステム中の各種の整合性制約、など連邦データベースシステムに関する定義情報を言う。従来の研究においては、スキーマの構築作業量が大きいという問題があった。この問題を解決するため、(1)関係データベースにおける質問の簡易化のために導入された概念である、普遍関係を採用することと、(2)用語辞書を用いて類似データ項目の分類を支援する機能を備えることを、主な特徴とするスキーマ構築方式を提案している。提案方式を実現する連邦データベース検索システムDBSENA (DataBase SEmantic NAvigation system)を試作し、さらにDBSENA使用時・未使用時とで実際にスキーマ構築を行い、その作業量データを比較し、提案方式がスキーマ構築の簡易化に有効であることを示した。

 第3章は「企業アプリケーション統合におけるデータ交換システムの構築方式」と題し、企業アプリケーション統合のデータ交換システムに関して、その構築方式を提案している。データ交換システムとは、基幹系のデータベースシステム間での直接的なデータ交換を実現するシステムを言う。従来より存在する、(1)業務として定常的にデータ交換を行なうシステム、(2)情報システム更改時用のデータ移行システム、(3)データ複製システム、等を包括する概念である。データ交換システムの構築において、交換先データベースシステムの自律性(レガシーシステムであり既存機能の改造が困難である、など)に起因して、交換先の既存データ入力インタフェースを改造無しに利用する制約などの、交換先への影響を極小化する制約を課された環境が考えられる。従来の研究においては、この環境を含む様々な環境向けのデータ交換システムを、少ない作業量で構築可能とする構築方式の研究は無かった。この問題を解決するため、先ず、様々な環境向けのデータ交換に必要な機能の明確化を狙いに、(1)データと機能の形式的なモデルの考案と、(2)それに基づく操作機能の導出とを特徴とする、データ交換処理モデルを提案している。次いで、構築簡易化を狙いに、(1)高水準な仕様記述言語を備えることと、(2)操作機能をソフトウェア部品として備えることとを特徴とする、データ交換システムの開発・実行環境を提案している。開発・実行環境を試作し、さらにその開発・実行環境の使用時・未使用時とで実際にデータ交換システムを構築し、その作業量データを比較し、提案するデータ交換処理モデルと開発・実行環境とが、それぞれ交換先への影響の極小化とデータ交換システムの構築の簡易化とに、有効であることを示した。

 第4章は「データウェアハウスにおけるオンラインデータローダの高速化方式」と題し、データウェアハウスのオンラインデータローダに関して、その高速化方式を提案している。オンラインデータローダとは、トランザクション技術を用いて基幹系データベースシステムからデータを抽出して、データウェアハウスに該データをロードするシステムを言う。基幹系データベースシステムから、大量のデータを検索することを特徴とする。従来の研究においては、オンラインデータローダ用の大量の検索を行うトランザクションと、少量のデータの検索・更新を行う通常のトランザクションとが共存する環境における、高性能なトランザクション同期制御方式が確立していなかった。特に、ミッションクリティカルなものが多数存在する通常のトランザクションの、高性能な実行を可能とする同期制御方式が確立していなかった。この問題を解決するため、トランザクションが検索専用の時は他トランザクションとの競合が少ないという特長を持つ多版時刻印方式と、従来のトランザクション同期制御方式の主流である、2相ロック方式とをベースに新たな方式を提案している。シミュレーションにより従来方式との性能比較を行い、提案方式が双方のトランザクションの高速な実行を可能にする方式であること、特にミッションクリティカルなものが多々ある通常のトランザクションの実行に関して、従来方式よりも顕著に優れた方式であることを示した。

 第5章は「結論」であり、本研究の成果・到達点を要約して述べている。

 以上を要するに、本論文は、既存の複数の非均質なデータベースを連携して利用可能とする技術を確立するために、種々の重要な問題の解決方式の提案を行い、それらの提案手法の有効性を確認するために、定量的な作業量データあるいは性能シミュレーションデータの比較により評価を行ったものであり、データベース技術分野に寄与するところが少なくない.

 よって著者は東京大学大学院工学系研究科における博士(工学)の学位審査に合格したものと認める.

UTokyo Repositoryリンク http://hdl.handle.net/2261/42865