学位論文要旨



No 114755
著者(漢字) セーヨー,サンティ
著者(英字) Saeyor,Santi
著者(カナ) セーヨー,サンティ
標題(和) 情報エージェントの枠組みによるWeb情報変化の監視と表示
標題(洋) Tracking and Viewing Changes in Web Repositories by Information Agent Framework
報告番号 114755
報告番号 甲14755
学位授与日 1999.09.30
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第4525号
研究科 工学系研究科
専攻 電子情報工学専攻
論文審査委員 主査: 東京大学 教授 石塚,満
 東京大学 教授 田中,英彦
 東京大学 教授 坂内,正夫
 東京大学 教授 安達,淳
 東京大学 教授 近山,隆
 東京大学 助教授 伊庭,斉志
内容要旨

 本研究では指定したWeb情報の変化を監視し、変化があった場合にユーザに通知して、変化の様子の表示を可能にするシステムである。現在はこの変化の監視の機能が中心であるが、今後他のサービスも容易に組み入れ、拡張できるように、エージェントコミュニティの枠組みの上に構築されている。このエージェントはモバイルエージェントであり、ユーザはこれらのエージェントに仕事を割り当てることにより代行人として働かせることができる。これらのモバイルエージェントは厳密に規定されている範囲外の行動はある程度自動的に決められることから、予期せぬような状況に対しても柔軟な対応が可能となる。Web情報の変化の監視機能は、指定されたWeb情報を定期的に監視し、変化を検出するサービスプロバイダエージェント、及びこの間の取りつぎを行う仲介機構とから構成される。

 以前のWeb情報はテキスト情報のみがサービスプロバイダに保持され、現在のWeb情報と比較される。HTML形式に適合して差分(削除部、変更部、追加部)の検出を効率的に行うアルゴリズムとして、最長共通タグ系列法(the longest common tag sequence method)を開発し、使用している。Web情報の変化は、ユーザ設定による情報フィルタでフィルタリングされ、所定の条件を満たすもののみユーザに電子メールで伝えられる。またサービスプロバイダは変化したWebページの変化分を視覚的に分り易く表示するHTML文書を作成し、ユーザは通常のWebブラウザによってこれを見ることができる。

 WWW情報空間は誰でもが容易に情報発信できることが大きな特徴であり、またストック型情報、フロー型情報の両者に対する媒体として利用できる空間である。ニュースのようなフロー型情報に対してはPush技術が浸透しつつある。ストック型情報はサーチエンジン等により検索し、利用するのが現在の形態であるが、ストック型情報においても価値があるのは変化分である場合が多い。このようなストック型情報の有意な変化分を検出する働きをする代理人として本研究で構成された情報エージェントの枠組みは有効である。これまでは注目すべき気になるWebページはBookmarkに登録して、時々チェックするといったことが必要であったが、このような作業を代行してくれる。各ユーザが注目すべきWebページを本システムに登録して利用するようになれば、情報発信者は自分のWebページに新情報を追加するだけで、関心を持っている多数の人々に大きな遅滞はなくこの情報が伝達されることになる。このように本研究の情報エージェントの枠組みはWWW情報空間上の新しい情報流通機構を可能にするものと考えられる。

審査要旨

 本論文は"Tracking and Viewing Changes in Web Repositories by Information Agent Framework(情報エージェントの枠組みによるWeb情報変化の監視と表示)"と題し、ネットワーク化情報社会における情報共有、流通の重要なインフラストラクチャになってきているWorld Wide Web(WWWあるいはWeb)における、新しい情報流通形態を可能にするシステムに関する研究・開発についてまとめたものであり、英文で記され、10章から構成されている。

 第1章"Introduction(序)"では、インターネットの発展によって進展しているネットワーク化情報社会におけるWWWの役割、状況について述べている。WWWは当初はストック型の情報をユーザがブラウジングして利用する形態が主であったが、最近ではフロー型の新規情報をユーザに遅滞なく伝達するPush技術も現われてきている。WWWが誰でもが容易に情報発信、アクセスできるストック型の情報倉庫としての性格を持ちながらも、フロー型情報の流通手段としても有効であることに着目し、Push技術とは異なるユーザが主体的に必要な新規情報を取得できる機構の重要性について論じている。これは具体的には、ユーザに代わって必要なWebページの変化を監視するシステムとなるが、類似の考えに基づく関連システムについて概説している。

 第2章"Changes in Web Repository(Web情報源の変化)"では、監視の対象とするWebの変化の形態と性質について分類し、考察している。即ち、考慮すべきWeb変化のカテゴリーとして、意味的内容、外観、存在性、テキスト/画像/参照リンク/埋め込みスクリプトなどの情報の形、周期的/非周期的といった変化の時間的性質、変化の量、変化の質等を列挙している。そして、ユーザが欲する変化内容と技術的可能性の観点から、検出すべきWeb情報変化について検討している。

 第3章"Dectecting Changes in Web Repositories(Web情報源の変化の検出)"では、2章で考察したWeb情報の変化を具体的に検出する方法について述べている。基本的に前回調査したHTML(Hyper-Text Markup Language)で記述されたWeb情報(画像情報は捨ててテキスト情報のみ)を保持しておき、これと現在のWeb情報との差分を検出することで、消去された情報、新規に追加された情報を検出するのであるが、HTMLの各種のタグ記述を利用して対応点候補を見い出し、ダイナミックプログラミングにより効率的に変化の検出を行う、Longest Common Tag Sequence(LOCTAGS)法を考案している。

 第4章"Notification(通知)"では、ユーザにとって過度の変化の通知は煩わしいものとなってしまうが、2章のWebの変化の種類についての検討に基づき、どのような変化の通知がユーザにとって好ましいかについて考察し、通知を行う情報フィルタの設計を行っている。この情報フィルタは以下のカテゴリーの変化毎に評点(スコア)を割り振っている。

 URL(Universal Resource Locator),Java Applet,画像,ページタイトル,背景画像,背景色,Header<H1><H2>,Header<H3><H4>…,テキスト。

 更に、新規の追加情報にユーザの指定したキーワードが含まれていた場合に加点するようにしている。この変化の評点の合計がユーザの指定した閾値を超えた時、電子メールで変化のあったWebページと変化の要約を通知するようになっている。

 第5章"Presentation of Changes in Web Repository(Web情報変化の表現)"では、Webページとしてユーザに一目で変化の様子を視覚化して提示する方法について検討している。前章に記したような変化の種類に応じて、消去分は選別して表示し、追加分についてはWebページとして表示されるテキストや画像はハイライト化して表示するのだが、他のJava Appletのようなプログラム部分は視覚化されないこともあるので特別に表示するようにしている。Webページ形式での差分情報の提示機能に加えて、キャラクタエージェントを用いて音声も含むマルチモーダルなWeb情報変化の提示法も示している。このための音声合成用のテキストの簡単な自動生成も行っている。

 第6章"The Framework of Change Monitoring Service(変化監視サービスの枠組み)"では、以上の要素機能に基づいて、ユーザに代わって必要なWeb情報源の変化を監視して通知するWebBeholderシステムを構成する、拡張性の高い枠組みについて論じている。このような枠組みとして、複数の移動情報エージェントと仲介エージェント、そしてサービス提供エージェントから成るモジュール的構成法を提示している。Web情報変化の監視サービスの場合、ユーザ側からサービス要求を伝達する移動情報エージェントがインターネットを通じてサービス提供センターのサイトに送られ、仲介エージェントを介して、Web情報変化の監視機能を持つサービス提供エージェントに送られ、サービスが提供されることになる。この枠組みはWeb情報の監視以外のサービスも埋め込める拡張性を有するものであり、必要とされる移動情報エージェントの扱いやエージェント間の通信機能等についての検討を示している。

 第7章"Resource Mangement(資源管理)"は前章の枠組みで、サービス提供センターで多数のユーザに対してWeb情報変化の監視のサービスを提供する場合の、資源の共有による効率化法について検討している。即ち、多数のユーザが存在する場合には、監視したいWebページ要求に重複が生じるので、これらを共通化することにより保持するWebページの量、変化検出のインダーネットトラヒック等の減少を図れることになる。しかし、各ユーザの要求は同一Webページの監視であっても、監視周期や通知の閾値が異なるなど微妙な点で一致しないことがあるので、監視要求を共通化できる率を高めるようにユーザに推奨、調整する機構を提示している。

 第8章"Formation of Cooperative Behavior Among Service Provider Agents(サービス提供エージェント間の協調動作の形成)"では、前章の資源の共有による効率化をより合理的に実現する機構を提示している。ここでは、マッチメーキングエージェントと呼ぶ仲介機構を置き、ユーザからの多数のサービス要求と、多数のサービス提供エージェントのサービス能力間を、コストを基準とするゲーム理論に基づく方法で、全体として費用対効用比が最大になるように調整する機能を与えている。サービス提供エージェントは提供できるサービスをコスト付きで提示し、ユーザ側は他と共通化できるサービスは低いコストで受け入れられることにより、調整が達成されることになる。

 第9章"Implementation(実装)"では、以上の検討に基づき具体的に実現したWebBeholderシステムについて述べている。このシステムは、ユーザからの変化の通知を受けたいWebページのURL、監視の範囲(そのWebページからリンクされた何段先までの範囲のWebページまでか、同一サイトのリンクされたWebページの範囲かなど)、監視の周期(6時間、12時間、1日、3日、1週間など)、変化通知の閾値等を受け、そのWebの範囲に変化があった時にユーザに電子メールで通知する。システムは主にJavaで記述されており、移動情報エージェントには日本IBMによるAgletを用いている。ユーザからのサービス受け付けインタフェースとしては、Agletを実装していないコンピュータからでもサービス登録可能なインタフェースも提供している。変化の視覚的表示は5章の方法で行われる。このシステムは既に定常的に稼働しており、現在(1999年7月)は20ユーザが登録しており、1000を超えるWebページの変化を監視し続けている。このサービスは広く一般にも公開されている。

 第10章は"Conclutions(結論)"であり、本論文の研究開発成果をまとめている。

 以上を要するに、本論文はネットワーク化情報社会の重要な情報共有、流通の手段になってきているWWWが、フロー型情報の流通手段としても有効であることに着目し、ユーザが主体的に監視して変化を知りたいWebページを登録することにより、遅滞なく必要な新規情報を取得できる機構について検討し、具体的なシステムとして実装した研究・開発について記している。このWebBeholderと呼ぶシステムは、広く一般にサービスできる実用レベルの形態になっている。このような検討とシステムの実現を通じて、WWW情報空間で情報提供者が自分のWebページに新情報を追加すれば、興味、関心を持つ多数の人々に情報が遅滞なく伝達される新機構を提案、具体化したものであり、電子情報工学上貢献するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク