学位論文要旨



No 112211
著者(漢字) 石井,和男
著者(英字)
著者(カナ) イシイ,カズオ
標題(和) ニューラルネットワークによる海中ロボット運動の表現と制御
標題(洋)
報告番号 112211
報告番号 甲12211
学位授与日 1996.09.30
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第3754号
研究科 工学系研究科
専攻 船舶海洋工学専攻
論文審査委員 主査: 東京大学 教授 浦,環
 東京大学 教授 吉田,宏一郎
 東京大学 教授 小山,健夫
 東京大学 助教授 大和,裕幸
 東京大学 助教授 鈴木,英之
内容要旨

 近年、コンピュータにおける飛躍的な処理能力の向上にも関連し、新たな海洋調査観測手法として無索無人潜水艇(UUS:Unmanned Untethered Submersible)が注目されている。特に自身で判断する機構を有し、環境に適応できる自律型の無索無人潜水艇をAUV(Autonoous Underwater Vehicle)、海中ロボットと呼ぶ。海中ロボットは、関連する技術も開発途上であり、未知の可能性を秘めている。本論文では、確立すべき要素技術の1つとして海中ロボットの運動の表現手法及び制御手法について取り扱う。

 海中ロボットは、自由な航行が可能なよう中性浮力に調整されるため、その運動は流体中での6自由度の運動となる。複雑な形状を有することも考えられ、運動モード間の相互影響や非線形な流体力を考慮する必要がある。また、与えられたミッションにより搭載するセンサやアクチュエータの変更が考えられ、それに基づく運動特性の変化に対して適応的に対処する必要がある。一方、ニューラルネットワークは、学習能力や非線形写像能力、自己組織化能力を有するため、時変で非線形性が強いシステムへの適用が期待されている。本論文では新たな海中ロボットの表現手法として、ニューラルネットワークを用いた手法について検討する。

 海中ロボットの運動を時系列で表現するには、操作入力の時系列と状態量の初期値から状態量の時系列を生成する必要がある。そこで、出力層及び中間層から入力層への2種類の回帰的結合(RC_1,RC_2)を有する構造の同定モデルを提案する。提案する同定モデルは、入力となる状態量を出力層から入力層への回帰的結合から回帰的に取得し、入力となる操作量及び状態量の時系列がモデル単体で得られる。中間層から入力層への回帰的結合RC_2は、入力変数の簡素化を行なうと同時に、過去の時系列の影響をモデル内に蓄えるために導入している。出力は1時間ステップ後の状態量である。以後、提案する同定モデルをIdentification Networkと呼ぶ。

 Identification Networkのネットワーク構造は、状態方程式をニューラルネットワークを用いて表現することを念頭において考案された。ここでは入力となる状態量を△Sf(t)(=Sf(t+△t)-Sf(t))とし、運動の評価対象となる状態量を△2Sf(t)(=△Sf(t+△t)-△Sf(t))、△Sf、Sfとする。シグモイド関数を入出力関数として持つニューロンよりなる3つの層と2つの積分層及び2種類の回帰的結合から構成されている。また、学習の収束を速め、動的な教示データの写像関係を良く表現するために、差分型ネットワークの構造を採用している。差分型ネットワークは、出力層において入力層に入力された状態量の高次差分を出力するネットワークである。通常のネットワークを用いて動的なシステムのモデルを表現する場合、入力値と出力値の差が小さいため恒等関数に近い写像を学習することになり、非常に困難である。出力値として高次の差分値を学習することにより、同定モデルの精度が向上し、動的なシステムの高次の振舞いまで表現することが可能となる。従って、Identification Networkの第3層における出力値は△2Sf(t)であり、2つの積分層を経てSf(t)を出力する。

 Identification Networkを具体的な航行型及び非航行型の海中ロボットの運動表現に適用し、その有効性の確認を行った。提案した同定モデルの出力と実験データは良く一致しており、十分な精度を有する同定モデルが得られていることが分かる。教示データの雑音にも係わらず、教示データから運動特性を抽出することに成功している。

 次に、ニューラルネットワークの問題点である知識の蓄積方法について提案する。ネットワークの出力の評価は、非常に重要であるにもかかわらず、出力そのものを評価することは難しい。入力変数が学習した領域内に存在する場合はある程度信頼性が高い出力を得られるが、学習した領域以外での保証がない。そこで、出力の評価を入力変数を用いて評価する手法を考案し、"随伴ネット(Descrictive Neural Network)"を提案した。評価対象のネットワークにおいて、入力、つまり学習した領域については、既知であるので判別は可能である。評価対象のネットワークが十分に収束したとすると、出力の信頼性は入力の信頼性で近似できる。このことにより、入力(学習領域)を確保する事により、信頼性を評価することが可能である。具体的には、学習した領域に対して"1"を出力し、それ以外の領域に対しては"0"を出力するネットワークである。随伴ネットを海中ロボットの同定モデルと組み合わせ運動シミュレーションを行なった。得られた結果は、学習した教示データに対しては高い値を出力し、それ以外のデータに対しては低い値を示した。随伴ネットによりネットワークの信頼性が得られる。

 海中ロボットの運動制御システムは、海中という未知の環境において柔軟に対処できる必要がある。既にニューラルネットワークを用いた適応的な制御システムとして自己生成型ニューラルネットコントローラシステム(SONCS:Self-Organizing Neural-net Controller System)が提案されている。従来のコントローラ調整法によって満足できるコントローラを得るには、ある一定時間の実航行により実験データをサンプリングし、そこから得られた時系列データの評価からコントローラを調整する、というプロセスを反復して行うことが必要であった。つまり、一回のコントローラ調整毎にある一定時間の実験データが必要とされる。そのため、精度の良いコントローラを得るまでにかなりの時間を要するという問題が存在した。ここでは、先に述べたIdentification NetworkをSONCSの運動モデルに導入する。これにより、SONCSの構造を(a)Real-World Partと(b)Imaginary-World Partの2つの独立した部分から構成することができる。

 (a)Real-World Partはフィードバック制御システムであり、制御対象と制御対象をコントロールするコントローラ(C_R)から成る。コントローラC_Rへの入力は制御目標値r(t)と制御対象から得られる状態量Se(t)との差であり、制御対象への操作量u(t)を出力する。

 (b)Imaginary-World Partは、コントローラ調整機構であり、フォワードモデル(FWD)とフォワードモデルを制御するコントローラ(C_I)から成る。コントローラC_Iへの入力は制御目標値r(t)とフォワードモデルから得られる状態量Sf(t)との差であり、フォワードモデルへ操作量u(t)を出力する。フォワードモデルはIdentification Networkであり、シミュレーション機能を持つ。入力はコントローラC_Iからの操作量u(t)と状態量の初期値であり、出力は一時間ステップ後の状態量Sf(t+△t)である。制御対象から得られるサンプリングデータを、フォワードモデルに随時学習させることにより、運動特性の変化に対処することが可能である。

 この構造を採用することにより、実時間でのオペレーションとは独立にコントローラの調整のための処理を行うことが可能となる。従って、これらの処理プロセスを並列に実行することにより、オンラインでのコントローラ調整を効率的に行うことができる。この高速なコントローラ生成法「Imaginary Training」と呼ぶ。提案するコントローラ生成法を海中ロボットの運動制御に適用し、その制御結果の検証を行なった。実験においても、Imaginary-World Partでのフォワードモデルの制御結果と同様な結果が得られており、フォワードモデルが制御対象の運動に関して良く表現できていることを示している。以上の実験結果から、目標関数に適合したコントローラの生成が行えることが分かる。

 海中ロボットの自律行動を実現するには、運動制御システムの適応性が重要な評価となる。ロボットの適応性は、未知な動作環境や情報に対する挙動を検討することにより判断できる。改良型SONCSは、並列処理能力を有するコンピュータシステムにおいて十分に能力を発揮する設計であり、SONCSの並列処理構造の実現も容易である。そこで、制御対象として、並列処理機能を有し演算能力の高いコンピュータシステムを搭載している海中ロボットTwin-Burgerを用いて実験を行なう。

 最初に、改良型SONCSの外乱に対する適応性を検討するため、Yaw運動のみを取り扱い、シミュレーション及び水槽実験を行なった。実験結果から、定常的な外乱に対しては、動特性の変化として同定モデル内部に取り込み、周期的な外力に対してはコントローラが逆位相の出力をすることにより、システム全体として外乱に対して柔軟な機能を有している事が分かった。つまり、外乱の影響を取り込んだフォワードモデルを制御し、定常状態での制御力から外乱に相当する力の算出がおこなえる。

 次に、潮流水槽において、流れが存在する状況を作り、流れの中での絶対座標系における経路追従実験を行った。実験では、オンラインでフォワードモデルの更新、コントローラの調整、実機の制御を並行して処理している。また、フォワードモデルを用いて外乱に相当する力を推定し、制御力に加算することにより、より柔軟なシステムの構築を行なった。実験結果から、潮流の影響が大きいSurge及びSwayの制御は、ミッションの初期において目標軌道からずれているものの、学習が進むに従い後半部では精度良く追従できている。Heave及びYawに関しては、全般的に良好に制御が行われている。しかし、後半部において外乱の推定が振動している。今後、適応制御に用いられている安定化手法の導入が重要となる。

 以上の検討及び実験結果から、提案するシステムが海中ロボットの運動制御システムとして十分な機能を有すると結論する。

審査要旨

 近年、コンピュータにおける飛躍的な処理能力の向上にも関連し、新たな海洋調査観測手法として無索無人潜水艇(UUS:Unmanned Untethered Submersible)が注目されている。特に自身で判断する機構を有し、環境に適応できる自律型の無索無人潜水艇をAUV(Autonomous Underwater Vehicle)あるいは海中ロボットと呼ぶ。海中ロボットを開発するには、通信手段の乏しさや外部環境把握の困難さ、あるいは3次元的な運動を考慮する必要がある。さらに、未知な動作環境において、得られた情報をもとに的確な行動が選択できる「自律性」など、様々な要素技術を確立する必要がある。本論は、海中ロボットを実現するための重要課題の一つとして、運動制御システムの開発に注目し、ニューラルネットワークの汎化能力を利用した新らしい海中ロボットの運動表現手法及び制御手法について論じている。

 開発された技術を検証するためには、実際に海中ロボットに適用し実験をおこなう必要がある。第1章では、近年開発された海中ロボットの成果の世界的な動向を検討している。

 第2章では、本論において主として用いられている航行型海中ロボット「PW45」及び汎用テストベッド「Twin-Burger」の設計目的及び搭載機器類について述べ、海中ロボットの開発において、開発目的を含めた設計思想と搭載機器類のバランスが必要となることを示している。

 第3章では、ニューラルネットワークを用いて海中ロボットの運動を表現する一般的な手法を提案している。ニューラルネットワークは、汎化能力や学習能力等が特徴として考えられており、対象システムの運動特性を教示データとして学習してネットワークを構築することにより、動的なシステムの表現が可能となる。本章で提案している運動モデルは、状態方程式を念頭においた構造を有しており、ロボットを操作することにより得られる状態量を基にして、操作量の時系列から状態量の時系列を出力する新たらしいモデル「Identification Network」を提案している。さらに、この運動モデルの学習により構築する手順について詳しく検討し、上記の海中ロボットに適用し良好な結果を得ている。

 第4章では、ニューラルネットワークにおける課題の一つである信頼性の評価について検討している。ネットワークの出力の評価は、非常に重要であるにもかかわらず、いわゆる外挿された出力に高い信頼性を付加することはできない。言い換えると、入力変数が学習した領域内に存在する場合はある程度信頼性が高い出力を得られるが、学習した領域以外での保証がない。そこで、出力の評価を入力変数が既に学習した領域内にあるかどうかを用いて評価することを考え、評価を再びニューラルネットを用いておこなうための「随伴ネット(Descriptive Neural Network)」を提案している。随伴ネットと運動モデルと組み合わせ、運動シミュレーションの評価を行っており、随伴ネットによりネットワークの信頼性が得られることを確認している。

 第5章では、先に述べた運動モデルIdentification Networkを導入した運動制御システム及びコントローラ生成法について論じている。提案している運動制御システムは、実時間に基づいて対象の運動を制御するReal-World Partとプロセッサの能力に依存して処理が行われるImaginary-World Partの2つの独立した部分から構成される。Imaginary-World Partは、運動モデルの更新及びコントローラの調整を実ロボットの操作と並列して処理することを念頭においた設計であり、運動特性の変化に応じたコントローラを効率良く生成することが可能である。本章において提案されている「Imaginary Training」は、運動モデルを用いた制御シミュレーションの結果を評価し、誤差逆伝播法によりコントローラの結合荷重を修正するコントローラの高速調整法である。運動モデルが制御対象の運動特性を十分に表現している場合において有効に機能する。実際に海中ロボットの運動制御に適用し、評価関数に応じたコントローラが生成されることを示している。

 第6章の前半部においては、提案した運動制御システムの外乱に対する適応性を検討するため、並列処理能力を有するコンピュータシステムを搭載しているテストベッドロボット「Twin-Burger」のYaw運動を取り扱い、シミュレーション及び水槽実験を通じて制御結果を議論している。制御結果から、定常的な外乱に対しては動特性の変化として運動モデル内部に取り込み、周期的な外力に対してはコントローラが逆位相の出力をすることを確認しており、システム全体として外乱に対して柔軟に機能することを示している。

 第6章の後半部では、外乱として流れを取り扱い、流れの中での絶対座標系における経路追従実験を行なっている。実験では、オンラインによる運動モデルの更新、コントローラの調整、実機の制御を並行して処理しており、学習の進行に伴い精度良く目標軌道を追従できることを確認している。

 これらの検討及び実験結果から、提案するシステムが海中ロボットの運動制御システムとして十分な機能を有すると結論しており、ニューラルネットワークによる運動制御システムの構築における新しい手法を運動の表現と制御という観点からまとめている。

 以上のように、本論文は、海中ロボット開発における重要課題である自動的に運動制御システムを構築するという課題において、ニューラルネットワークを用いた新たな手法の有効性を示したものであり、船舶海洋工学の進歩に資するところが大きい。よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク http://hdl.handle.net/2261/54545