学位論文要旨



No 123093
著者(漢字) 井川,数志
著者(英字)
著者(カナ) イガワ,カズシ
標題(和) 胸腺教育機構に基づく人工免疫系の研究 : 自己・非自己の識別とパターン識別
標題(洋)
報告番号 123093
報告番号 甲23093
学位授与日 2007.11.15
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第6670号
研究科 工学系研究科
専攻 システム量子工学専攻
論文審査委員 主査: 東京大学 教授 大橋,弘忠
 東京大学 教授 越塚,誠一
 東京大学 准教授 陳,迎
 東京大学 准教授 陳,
 東京大学 准教授 藤井,信忠
 東京大学 講師 橋本,康弘
内容要旨 要旨を表示する

近年,人工免疫系(Artificial Immune Systems,AIS)が計算科学,工学の分野で注目されている.人工免疫系とは,何らかの問題を解決するために,理論免疫学や免疫系で観測される免疫応答,原理やモデルから想起された計算手法である.その中でも,従来から盛んに研究,議論されているものの1つにネガティブ選択アルゴリズム(Negative Selection Algorithm)がある.変化検知や異常検知(Change/Anomaly Detection)で研究され,さらなる発展が期待されている.ネガティブ選択アルゴリズムは,ある種の問題には適していると言われる一方で,以下の3つの理由からパターン識別(Classification)には不向きとも指摘される.

その理由とは.

1)疑似細胞獲得過程が非効率であること.

2)過学習を防ぐ仕組みをもっていないこと.

3)疑似細胞がクラスに関して断片的な情報しかもっていないこと.

このため,識別問題への適用については,現在も議論の渦中にある.実際に,複数のクラスで構成される一般的な識別問題への適用例は少なく,汎用的な枠組みは存在していない.

そこで本研究では,ネガティブ選択アルゴリズムを一般的なパターン識別に適用できるように拡張し,新しい人工免疫系,Artificial Negative Selection Classifier(ANSC)を提案する.従来,識別問題に不向きであるとされていたネガティブ選択アルゴリズムを用いて,汎用的かつノイズ耐性も有する識別器を構築できることを示す.本研究は新しい識別器の確立とともに,人工免疫系の議論に一石を投じる具体的研究の1つである.

本論文の構成は以下のとおりである.

第2章では,免疫系と人工免疫系について概説する.まず,免疫系の概要を述べ,適応免疫系についてパターン認識の観点から解説する.そして,人工免疫系において,免疫系をモデル化する方法を述べる.そのため,免疫系の機能を用いて問題を解決するためのフレームワーク,細胞の抽象モデル化について記す.そして,人工免疫系の現状を調べ,本研究に至る研究の流れを明らかにする.

第3章では,ネガティブ選択アルゴリズムを用いた人工免疫系(Artificial Negative Selection Classifier,ANSC)を導入する.胸腺教育機構における自己・非自己の確立から得られたネガティブ選択アルゴリズムをパターン識別用に拡張する.特に,各細胞に可変認識閾値を導入する.ANSCはこの拡張されたアルゴリズムと,未知のデータを識別する判定アルゴリズムから構成される.そして,人工データ集合を用いてANSCの挙動を視覚的に確認し,それらのデータ集合に対する統計的な特性を明らかにする.さらに,ノイズに対する考察を行い,ノイズの影響を緩和する方法を提案する.この章の最後には,可変・固定認識閾値による結果を比較・検討し,可変認識閾値の重要性を考察する.

第4章では,実世界データ集合を用いて,ANSCの特性を考察する.ここでは,ANSCの識別精度を他の識別器のものと比較し,ANSCの独自性を述べる.また,統計的観点から考察を行い,人工免疫系の識別器であるArtificial Immune Recognition Systemとの比較・検討を行う.さらに,本論文で導入した可変認識閾値の利点について考察する.

第5章では,文書の識別を行う.文書としてHTML文書集合を用いる.期待情報量を用いて文書から特徴ベクトルを抽出し,識別を行う.そして,ベイズ推定の結果と比較・検討する.また,特徴ベクトルの次元とANSCの挙動についての考察も行う.

第6章では,人工リンパ球の形状を超楕円型に拡張する.まず,人工リンパ球の拡張方法を述べ,その変異過程に回転・拡大縮小操作を導入する.そして,その挙動を確認し,特性を考察する.

第7章は結論である.

審査要旨 要旨を表示する

生命は、環境の変動や外敵などの外乱に対して、柔軟に対応し機能を継続して働かせていく能力を有している。これは生命進化の過程を通して獲得された能力であり、さまざまな変動に対して機能的な柔軟性を持ち、不確実性や不完全さに対応できるような機構を備えた結果である。この代表は免疫系であり、細胞レベルにおいて外敵を認識するため、きわめて巧妙な自己・非自己の識別機構を備えている。

このような生命のもつ機構を規範とすることにより、より柔軟で、情報量の増大に対応でき、不確実性や変動への優れた適応能力をもつ効率的な情報処理技術を開発することが期待できる。

本研究は、このような背景から、免疫系を規範とした人工免疫系を研究対象とし、免疫系のもつ認識機構を参照した効率の良い新しい識別分類手法を研究開発したものであり、ネガティブ選択アルゴリズムの有用性を確認し、それに基づく識別分類手法の提案、実証と拡張を行ったものである。本論文は、このような研究の成果を7つの章にまとめている。

第1章は序論であり、研究の背景と位置付けをまとめたものである。計算科学における人工免疫系に関する考え方をまとめ、研究目的を述べている。

第2章は本研究の基礎となる免疫系、人工免疫系について述べた章である。まず、免疫系の認識、学習機構についてまとめ、人工免疫系で重要となるものを抽出している。人工免疫系については、形状空間、親和度などの概念を導入し、モデル化、アルゴリズムについて詳細に検討している。

第3章は本研究で提案する新しいネガティブ選択アルゴリズムについて述べた章である。まず、認識条件などを定義した人工リンパ球を導入し、そのレセプターの変異、クローン生成、選択の過程を通して学習するアルゴリズムと、自己・非自己の判定アルゴリズムにより構成される識別機構で、可変の認識閾値をもつ人工ネガティブ選択識別機構を提案している。これを2次元データに適用し、認識閾値を適切に設定することにより、計算効率を上げながら精度を向上できることを示している。また、一般にノイズが過学習を引き起こす問題点に対して、可変認識閾値を利用した活性度を導入し、この活性度に閾値を設定することにより、ノイズの影響を効果的に抑制することが可能であることを示している。

第4章では、第3章で開発した手法を標準問題に適用し、その妥当性と有効性を実証している。分類問題における標準問題として、4~60次元、2~6クラスにわたるものを6種類取り上げ、それぞれについて本手法と他の識別分類手法との比較検討を行っている。これより、本手法が識別精度において他の手法と遜色ないこと、高次元問題に対して優れた性能を示すこと、汎用的で、訓練とテストの両方を考慮すると総合して最高識別精度をもつことなどを実証している。さらに、ノイズ除去についても、活性度閾値を利用する本手法が、実用問題に近い広い範囲の標準問題に対しても有効であることを示している。

第5章は実用問題への応用として、HTML文書の集合に対して本手法を用いて識別分類した結果をまとめている。HTML文書を期待情報量による重要度を基にして単語を抽出し、その有無により文書をベクトル化し識別している。他の手法と比較して、少ないデータ数からでも安定した識別分類精度が得られることを示している。

第6章では、新しい試みとして、楕円型人工リンパ球を用いた場合の検討を行っている。これは各次元ごとに識別判定の距離の重みが異なることから、それぞれの次元ごとに特徴的な半径を備えた超楕円型のリンパ球を利用する識別分類手法である。球形リンパ球の場合と比較を行い、サンプルの局所構造をより詳細に学習できること、精度の向上と識別に必要なリンパ球数の低減が期待できることを実証している。

第7章は結論であり、本研究で得られた成果をまとめた章である。

以上を要するに、本論文は、人工免疫系の機構を利用する識別分類機構として、可変認識閾値を備えたネガティブ選択アルゴリズムを用いるものを新たに提案し、基本問題と標準問題に対してその妥当性と有効性を実証し、さらに、実用問題への適用、より効率の良い楕円型リンパ球の提案を通して工学問題への適用性を示したものであり、今後の人工免疫系研究の進展に寄与するところが少なくない。

よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク