学位論文要旨



No 116971
著者(漢字) 榊原,庸貴
著者(英字)
著者(カナ) サカキバラ,ツネキ
標題(和) プロセスモデルによる共通オブジェクト設計手法に関する研究
標題(洋) A Study on A Common Objects Designing Methodology Based on Process-Models
報告番号 116971
報告番号 甲16971
学位授与日 2002.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第5112号
研究科 工学系研究科
専攻 社会基盤工学専攻
論文審査委員 主査: 東京大学 教授 柴崎,亮介
 東京大学 教授 野城,智也
 東京大学 教授 清水,英範
 東京大学 助教授 目黒,公郎
 東京大学 講師 堀田,昌英
内容要旨 要旨を表示する

 1990年代後半からのコンピュータやインターネットの急速な発展・普及にともない、(1)情報通信インフラの整備、(2)高度情報通信社会の構築が社会全体のニーズとして急浮上した。これに対して政府は平成9年11月に『行政情報化推進基本計画』、平成11年5月に『行政機関が保有する情報の公開に関する法律(情報公開法)』を主軸に、国民の利便性を向上させる情報化の推進を打ちだした。これを受け、国土交通省では、政府調達や各種申請の電子化、業務の電子化による効率化や連携をめざして、旧建設省時代より建設CALS/ECや国土空間データ基盤に関する研究や検討を行ってきた。そうしたなか、平成7年1月の阪神・淡路大震災を期にGISに対する期待は急速に大きくなり、官側では「GIS関連省庁連絡会議」および「GIS官民推進協議会」が、民側では「国土空間データ基盤推進協議会(NSDIPA)」が設立され、官民あげての国土空間データ基盤の整備・普及に向けた体制が整い、本格的な議論が開始された。さらに、今年、IT戦略本部は「e-Japan戦略」、「e-Japan重点計画」を相次いで決定したが、そのなかでは、社会のモデル化やシミュレーションを行うバーチャルな国土の形成という観点からそれまでの国土空間データ基盤を「電子国土」という概念に拡大して重点整備項目の1つとした。このように国土空間データ基盤をテーマに、必要な制度や運用上の問題に関する議論や国内外に渡っての空間データの標準化活動、空間データ基盤を支える個別要素技術の開発・実験が行われてきた。しかし、空間データ基盤構築にあたって、これまでまったく議論されてこなかったテーマとして「何を空間データ基盤のコンテンツにするか」という課題がある。インフラとして空間データ基盤を構築する以上、そのコンテンツに対してアカウンタビリティが必要とされるからである。

 そこで本研究では空間データ基盤のコンテンツ設計にあたってアカウンタビリティをもったコンテンツを抽出する方法論を開発することを目的とする。情報に対するアカウンタビリティを「その情報がどの程度あるいはどのように利用されるか」を明らかにすると考え、情報とそれを利用する活動を関係付けながらモデル化することにより、それぞれの情報が影響する活動を明らかにする、共通オブジェクト設計手法を開発することとした。

 共通オブジェクト設計手法を開発するにあたってはまず手法に対する要求を把握しなければならない。本研究ではこれを関連する手法としてのシステム分析・設計から導出される機能的要求と結果がインフラにつながることから導出される社会的要求とにわけて整理した。機能的要求としては、(1)データおよび手続き(業務)を明らかにする、(2)システム導入前後の業務だけでなく、業務目的をも含めたモデル化が可能である、(3)類似する業務の発見を支援する、という3つに集約することができる。また、社会的要求としては、(1)より多くの利用者の効果的かつ効率的な利用を実現する、(2)少なくとも10年単位での安定性を有する、という2点があげられる。

 本手法ではこれらの要求に対して図1に示す解決を与える。

 本手法ではユーザ業務の分析により抽出されるひとまとまりの業務(ビジネスユースケース)および業務目的をプロセスとよび、各プロセスで必要とするデータあるいは結果として生成されるデータをデータ項目とよぶ。それらは、あるユーザ(これをアクタとよぶ)がもつ最も抽象度の高い業務目的に相当する1つのプロセスに端を発する階層モデルとして表され、これをプロセスモデルとよぶ。これにより(1)および(2)の要求を解決する。(3)に対してはプロセスやデータ項目の表記のなかで使用されている名詞および動詞の類似性を利用し、(4)からは複数ドメインをまとめての一括処理の必要性が導出される。また、(5)に対しては空間データ基盤のデータ構造は進化させつつもデータは連続的に受け継がれるように、手法として分析・設計を繰り返すことを前提にすることとした。

 本研究で開発する手法は以上の本手法に対する要求を満足するため、分析・設計工程を2つに分割した。

 第1工程を「モデリング」とよび、(1)データ利用者(これをアクタとよぶ)がどのような活動を行い、それぞれの活動ではどのようなデータが利用あるいは結果として得られるのかを明らかにする、(2)そのアクタの属するコミュニティ(これをドメインとよぶ)において用語がどのような関係(同義あるいは広義・狭義)をもつかを明らかにする、ことを目的とする。第2工程を「分析」とよび、(1)モデリングによって得られた結果から類似性の高いデータを発見し、より多くの利用の見込まれるデータを抽出することを目的とする。

 モデリングはドメインモデラとよぶ作業者により実施され、各担当ドメインからプロセスモデルおよび単語関連モデルという2つのモデルを抽出する。本手法ではひとまとまりとみなすことができる活動および活動目的をプロセスとよび、特に前者を作業ベースのプロセス、後者を目的ベースのプロセスとよぶ。プロセスには抽象度(処理の具体性)に違いが存在するが、本手法ではこれを階層構造で表現し、プロセスモデルとよぶことにする。プロセスモデルの末端のプロセスは各業務においてシステムを開発したとするときのシステム名称程度(たとえば、「最短経路探索(システム)」、「障害物通報受付(システム)」など)にとどめるものとする。末端のプロセスに対してそこで利用あるいは結果として得られる情報(の名称)をデータ項目として抽出する。なお、プロセスモデルの抽出は分析全体を統括する分析管理者により指定された共通オブジェクト設計の対象ドメインに対してのみ行う。

 ドメインモデラはプロセスモデルを抽出したところで、そのデータ項目の表記に使用している名詞とそれらの間の関係(同義、広義・狭義関係、言語上の接続関係)を表した単語関連モデルを作成する。分析工程で行う類似するデータ項目の発見は、単語関連モデルに基づいて表記の類似するものを抽出するためである。

 分析は全体を統括する分析管理者により行われる。ここでは、統合単語関連モデルと標準データ名とよぶ2つの中間要素を生成し、最終的に共通オブジェクトを決定する。分析ではまず、モデリングで得られたすべての単語関連モデルを1つにまとめ、統合単語関連モデルを作成する。これはドメインによるデータ項目の表記の違いを吸収する役割も担うもので、全対象ドメインに対する単語間の関係を定義することができる。次にそのなかから同義、広義・狭義関係のみを抽出し、単語関連辞書を生成する。これにより各ドメインの知識が自然言語処理可能な形に変換される。

 次に1つのオブジェクトに集約可能なデータ項目の抽出を行う。データ項目はプロセスに依存した表現がなされているため、表現の一致するものを検索するだけでは不十分である。そこで、本手法では同義、広義・狭義関係により比較的近い概念をもつ名詞からなるデータ項目は全体としても概念が近い可能性が高いと考え、まずデータ項目を形態素に分解し、単語関連辞書を適用することで、標準データ形式に変換する。その後、構成要素の集合が包含関係にある標準データ形式に属するデータ項目のなかから、想定されるデータ構造を考慮して集約可能なデータ項目を選定し、代表名を与える。最後に、このようにして得られた各代表名に、集約されなかったデータ項目を加え、それぞれの全プロセスモデル中での入力あるいは出力としての参照回数を基に共通オブジェクトにすべきものを決定する。なお、プロセスに対しては発生頻度や重要度などを重みとして与えることができ、そうした重みを考慮して、共通オブジェクトを決定することもできる。(本手法では重みの扱いについては言及しない。)

 以上の手法に対しプロトタイプの開発を試みながら、国道管理における共通基盤データベースの設計を対象にケーススタディを実施した。本ケーススタディでは対象ドメイン、アクタおよび最上位のプロセスを表1に示すように決定した。さらに各ドメインに対して表2に示すプロセスモデルおよび図6に示す単語関連モデルを抽出した。

◎自動車利用者へのサービス

■安全な道路交通を確保する

■交通事故を防止する

■障害物による事故を防ぐ

■R障害物を発見、迅速に除去する

□障害物を迅速に発見する

□障害物を発見・位置特定をする

□通報を受ける

□位置特定をする

○ 障害物情報:大きさ、位置、内容、道路利用者への阻害の程度

! 目視、センサポジショニングシステム、通報からの位置特定、危険物輸送情報

□危険性を判断する

I 障害物情報:大きさ、位置、内容、道路利用者への阻害の程度

! 発見・位置特定をする、通報を受け、位置特定をする

I 周辺の道路利用状況:時刻・天候、交通量、速度、歩行者量、沿道の人口密度・活動密度、危険物の存在

! 目視、既存資料

○ 障害物の危険性と、除去の緊急性

 図7に抽出した共通オブジェクトの一部を示す。これから手法により、(1)1つのデータとして扱うことのできるデータ項目の集合、(2)1つのデータであるかのようにユーザに対して提示すべきデータの集合を抽出することが可能であり、したがって、これらを共通オブジェクトとすることができることが確認された。

 以上のように、インフラレベルの共通基盤データベースのコンテンツである共通オブジェクト設計を支援する手法を開発することができた。なお、手法を繰り返し適用する際に必要となる共通オブジェクトの初期値の扱いを規定すること、および集約可能なデータ項目抽出を支援する追加的な作業として、類似するプロセスを抽出することが、今後早急に導入しなければならない課題としてあげられる。

図1 本手法への要求の解決方法

図2 本手法の構成

図3 プロセスモデル

図4 単語関連モデルのコンテンツ

図5 類似するデータ項目の抽出

表1.本ケーススタディにおける対象ドメイン、アクタおよび最上位のプロセス

表2.抽出したプロセスモデル(一部)

図6 作成した単語関連モデル(一部)

図7 抽出した共通オブジェクト(一部)

審査要旨 要旨を表示する

 多数の情報システムが乱立するにつれて、お互いの間でのデータの重複や情報の不整合などの問題が深刻になりつつある。またそれぞれのシステムが連携して動かないことも多く、複合的なサービスを実現しようとすると一つのシステムが必要な機能全部をカバーする必要が生じるなど、機能面での重複もシステム開発の重荷となっている。システムの保有するさまざまなデータ・情報を交換可能にし、機能やサービスを相互利用可能にすることができれば、データの重複整備・投資が軽減され、互いの不整合が少なくなるだけではなく、さまざまなシステムが連携することでより高度なサービスを実現することができる。また個別システムはそれぞれ特色のある機能に特化した開発を行えることから、より高性能な機能実現が達成されると期待される。

 こうしたデータの共通化やサービスの相互利用性は従来、いわゆる「標準化活動」により実現すると多くの人(特に利用者)に信じられている。しかしながら、標準の多くはデータなどの表現形式の統一化を進めるだけであり、他のシステム(あるいは情報プロバイダ)によって作成されたデータを他のシステムは読むことを可能にはする。しかし、データ項目の定義の違いやスキーマの違いなどを自動的に吸収することは一般には困難であり、手作業に頼らざるを得ない。つまりネットワークなどを介してリアルタイムかつ自動的にシステムを連携させることはできない。結局データの重複をなくし、システムの提供するサービスなどを連携させようとするとそこで利用されるデータオブジェクトを定義なども含めて共通化してしまうことが一番確実な方法となる。たとえば大規模構造物や建築物の設計作業においてデータの交換と(上記のような意味の)システム連携を図るために、頻繁に交換され、共有化される必要のあるデータ項目を抽出し、共通オブジェクトカタログを作ろうというプロジェクト(例:LEXICON)が進められている。またドイツ連邦政府では調査から供用・運用にいたる道路事業全体で共通化すべきデータオブジェクトを定めている(OKSTRAプロジェクト)。

 こうした共通オブジェクトの設計は、関連する幅広い業務や事業においてどのようなデータが生成・参照されているかを調査したうえで、その中から重要と思われるデータ項目を共通化するという手順で進められている。しかし、共通の方法論や支援ツールもなく、実際の作業はアドホックに行われており、膨大な手間と時間を要しているのが実際である。一方、従来から情報システム設計で行われている手法は個別システムの比較的詳細な設計には向いているものの、多くの情報システムを横断的に概観し、共通部分を効率的に拾い出す一方で、それらの「共通部分候補」がどの程度多くの分野で参照され、それを共通化することによりどの程度の便益が全体に発生するのかを明らかにするというようなタスクには十分対応していない。本論文はこうした問題意識から既にシステム化されている業務もされていない業務も含めて全体を概観・整理し、共通オブジェクトを抽出・設計する方法を支援ツールも合わせて体系的に開発したものである。

 本論文の構成は以下の通りである。第1章は研究の背景と目的を整理しており、上述のような情報の共通化の重要性と予想される技術的な課題を述べている。第2章は関連する手法と本手法に対する要件についてまとめている。すなわち、本来どんな手法が必要かを整理した上で既存の手法がどういった限界を有しているかを明らかにしている。第3章は提案された共通オブジェクトの設計手法の概要であり、手法の概念的なフレームワークと手法の主要な段階、すなわちプロセスモデリング、プロセスモデルからの単語抽出と単語関連モデルの構築、プロセスモデルとの参照関係の集計・分析、共通オブジェクトの抽出作業などを整理している。第4章と第5章は第3章の枠組みに従って設計手法の詳細を述べている。また設計手法を支援するためのツールの考え方と内容に関してもこれらの章で詳細に記述している。第6章はケーススタディを道路管理業務に対して行い、道路管理全体でどういったオブジェクトを共通にすることが望ましいかを導出した結果とその過程で発見された課題に関して整理している。第7章は研究の結論と今後の課題を整理している。

 本論文の手法上の特徴は以下のようにまとめられる。

 1) さまざまな業務を効率的にプロセスモデルに構築するための工夫として、階層的なモデリング方法を採用している。すなわち業務のミッションをまず整理しそれを達成するために必要なタスクあるいは副目標を抽出し、さらにそれらを達成するために必要なタスクを抽出するというように階層的に業務内容を整理することで、業務の実務的・詳細な手順に精通していなくても網羅的に内容を整理できる。また、実際の業務で実は十分カバーできていない箇所の発見などにも役立つ。

 2) プロセスモデルから抽出される参照データオブジェクトの拾い出しや整理に自然言語処理手法を活用している。これまでのシステム設計の方法論では、参照されるデータ項目の拾い出し方法などを規定することはあっても、拾い出されたデータ項目(当然自然言語で記述されているが)の処理・分析、集約などに自然言語処理手法を積極的に利用することはなかった。しかし、多数のプロセスモデルから共通に参照されるデータオブジェクトを拾い出すためには、手作業に頼っていては見落としなどが避けられないし、あまりにも非効率である。そこで参照データ項目に関する記述を機械的に処理し、その構造や参照回数を拾い出すことで、共通オブジェクトの抽出をできるだけ効率的、合理的に行う手法を開発した。

 3) 上記の設計作業を支援するためのツールを構築している。このツールを利用することで従来多量の資料の山に埋もれることの多かったこの種の作業を効率化できるだけでなく、全体像を俯瞰することを可能にし、共通オブジェクトの抽出・設計に関する合意形成を容易にすることにも成功している。またこのツールは従来の情報システム設計に標準的に利用されるUMLツールとの連携も考慮されていることから、共通オブジェクト設計の結果をそのまま個別システムの設計に活かすことも可能になる。

 これらの手法的な特徴に加え本論文の特徴はなんといっても共通オブジェクトの設計の重要性を認識し、これまで単なる力作業としてアドホックに進められていた作業を、体系化した方法論で透明かつ合理的に進められるようにした点にある。このように本論文は社会的な貢献が極めて大であるとともに、着眼点、手法ともに大変ユニークである。よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク