学位論文要旨



No 117082
著者(漢字) 片岡,一朗
著者(英字)
著者(カナ) カタオカ,イチロウ
標題(和) 状況適応型プラント・ヒューマンマシン・インタフェースに関する研究
標題(洋)
報告番号 117082
報告番号 甲17082
学位授与日 2002.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第5223号
研究科 工学系研究科
専攻 システム量子工学専攻
論文審査委員 主査: 東京大学 教授 近藤,駿介
 東京大学 教授 大橋,弘忠
 東京大学 教授 古田,一雄
 東京大学 教授 吉村,忍
 東京大学 助教授 高橋,浩之
 東京大学 助教授 中田,圭一
内容要旨 要旨を表示する

 大規模複雑なシステム,故障率は低いが事故発生時の災害レベルが大きい原子力プラントなどのシステムでは,人間と機械が協調しタスクを実行することがシステム全体としての安全性や信頼性の点から必要であり,そのためには人間と機械との有効な協調を実現するインタフェース設計が重要となる.人間と機械との有効な協調を実現するためには,人間と機械とが互いに相手の振舞いのもととなっている意図や論理を理解することが必要であり,プラントにおいて運転員の意図が理解できるかどうかの意図推論機能の有無が支援システムの知的レベルを決定すると考えられる.相手の振舞いのもととなっている意図を推論し,推論結果よりプラント運転員へ適切な情報を提示することは,運転員の操作負荷の軽減,状態認識把握の容易さなどの点より有効である.

 本研究では、人間と機械の有効な協調を実現するための状況適応型プラントヒューマンマシンインタフェースの研究を行った.プラント運転員を支援するため,運転員が何をしようとしているかの内容に対応した表示内容と形態で情報を提示し,運転員が望む情報提示方法を学習する.学習の初期状態では,設計段階でシステム設計者が決定した手法をもとに設計者が妥当と考える知識を反映させた提示関係で情報が提示されるが,学習が進むにつれ,運転員が望む提示関係へと変化する.学習型インタフェースの長所として,パネル操作負荷の軽減と,設計コストの削減が挙げられる.タスク目標は同じでも,運転員が望む情報は運転員ごとに異なる場合が存在すると考えられ,タスク目標と1対1に対応させた情報提示を行うと,運転員にとっては望まない情報が提示されることにより状態認識が正しく行われず,認識に時間がかかる,または誤操作の発生がありうる.運転員が望むパネルを学習することで,再び同じ状況になったときも運転員が望むパネルを提示することが可能であり,パネル呼び出し操作を軽減することに繋がる.そのため,状況認識を早めることが可能であると思われる.システムは,マルチエージェントシステムを用いたセンサバリデーションによるセンサ異常情報の警報器への提示,ベイジアンネットワークによる運転員の状態認識を行う状態認識部,さらに機械学習を行う学習部,運転員に対応した情報提示を行う情報提示部より構成される(図1).

 対象として,2水槽系モデルであるDURESS(Dual Reservoir System Simulation)へ適用する.DURESSは,2つのタンク,2つのヒータ,7つのバルブと液体を輸送するパイプから構成されており,ヒータ出力,バルブ開度を調節することが可能である.一般のプラントに見られる現象を表現しており,プラントを代表するモデルとしてインタフェースに関する研究で利用されている.

 状態認識部では,運転員がプラント状態をもとに,何を行おうとしているかの状態認識の推論を行う.状態認識の推論結果より,運転員が考えるタスク目標を導出する.運転員の認識過程をベイジアンネットワークに基づく確率遷移計算によりモデル化した研究を参考に,運転員の認知行動をもとに,抽象−特定の構造を有するベイジアンネットワークを構築する.ベイジアンネットワークにおいて,人間の信念状態を表現した場合,各ノードへ割り当てられた確率値は,そのノードが成立することに対する人間の主観的な確信度を表すと解釈することとし.ベイジアンネットワークは,最も一般的な状態として「異常」という状態が存在すると考え,「異常」という状態がより特定的である状態に分類され,さらにその各状態がより特定的な状態へ分類されることによって表現される状態階層をより特定的な状態がより一般的な状態の生起を支持している,とした因果関係に見立て構築した.

 運転員の状態階層図は,DURESS操作において運転員が行う目標・タスクに応じた構造を考慮した.目標手段タスク解析法より,目標から導出されたタスクをツリー構造としてタスク階層図を構成し,正常,運転停止,起動の状態を示すノードを追加した.状態認識をもとに目標(タスク)を決定する.状態認識において,異常と認識した部分より目標を決定するため,状態階層図にタスク目標ノードを追加する.状態ノードとタスク目標ノードが繋がっており,状態ノードよりタスク目標ノードの確信度が算出される.これにより,運転員はどのタスクを行うかの認識を行う.また,タンクA,Bそれぞれの要求流量,要求温度の目標が存在するため,要求流量変化,要求温度変化を表す徴候ノードを正常ノードの下に加え,図2に示すようなDURESS全体の状態認識部を構築した.ベイジアンネットワークモデルの効果を検証するため,シミュレーションを行った.ある時間でタンク温度が低下したとき,モデルはどのタスクを行うかを計算する.徴候ノードに入る値は,センサ値をファジィ化し,[0,1]とした.図3,4は,タンク温度が低下した時の各状態ノードにおける確信度の推移を示している.タンク温度が低下したという観測が行われることにより,タンク温度低下という事象が徴候ノードへ入り,証拠の伝播による事後確率の計算が行われ,状態ノードの確信度が決定される.

 学習部では,経験強化型機械学習であるProfit Sharing(以下PS)を採用する.PSは,(1)適用可能な環境のクラスが広い,(2)素早い学習が可能である等の特徴を有し,実問題への適用に向いている.PSでは,タスク目標と行動の対であるルールを設定し,ルールの重みが強いものが選ばれる確率は高くなる.学習部では,運転員の望む情報がどれであるかを知り,運転員に応じて情報を適応提示するための計算を行う.運転員ごとに望む情報は異なり,提示する情報の内容によっては運転員の操作負荷も変化するものと考えられる.そのため,運転員の操作負荷を軽減する目的で,学習により情報を適応提示する.どの情報を提示するかを行動とし,運転員が提示されている情報とは異なる情報を呼び出した時,今まで提示されていた情報とタスク目標に対応するルールの重みを弱め,新しく呼び出された情報とタスク目標のルールの重みを強化する.運転員より新しく情報が呼び出されるごとに,1エピソードが更新される.

 情報提示部では,学習部で選ばれたルールに対応する行動をもとに,パネル提示を行う.運転員に提示するパネルは,以下の二つのチャンネルより構成される(図5).

・全体チャンネル:ミミック表示などのプラントの機構特性をアフォードした表示を設け,運転員の意図に依存しない大局的情報を表示する.

・特定化情報チャンネル:運転員の意図するタスクに対する必要な操作個所,操作量等の情報を表示する.

特定化情報チャンネルでは,プラント各部の状態を視覚的に表示し,表示する内容を運転員の認知資源を考慮し,運転員の認知活動に合わせて切り替える.それぞれのタスクから運転員が操作個所,操作量等の入力操作を導出する際に参考となる情報を提示し,棒グラフ,トレンドグラフ,ポリゴン,相関図による視覚的表示方法を用いる.

 学習によるパネル提示と学習を用いず提示するパネルが切り替わる場合で比較実験を行った.また,複数の被験者によるパネル呼出操作の比較を行い,個人差がどの程度まで表れ,どの程度まで学習による提示で吸収することができるかを調べた.被験者は,工科系の大学院生6名で,最初に文書と口頭によるプラント構造と標準的操作の手順を示した後,実際にシミュレータを操作して練習を行った.その後,DURESSの操作実験を行った.パネルの学習による提示では,運転員の状態認識の推論結果と学習を組み合わせたモデルをもとに,パネルの自動切り替えを行う.複数の被験者によるパネル呼出操作の比較では,被験者の操作としてMr.A,B,C,D,E,Fの順番で行った.タスクと提示するパネルの提示関係は,学習が進むにつれ運転員が望むタスクとパネルの提示関係へ変化する.方針として,プラントが正常状態にある時は全プラント状態を含めた表示を行い(相関図),故障発生などの異常状態時には今後の予測を与える表示(トレンドグラフ)を原則とした.アンケートによる評価とパフォーマンスによる評価として,被験者が抱く負荷をNASA-TLX,及びパネルを呼び出す回数等により評価する.シナリオは,100秒ごとに要求流量変化,要求温度変化,ポンプ故障,バルブ固着を設定し,650秒まで行う.被験者の目標は,タンクA,B系統のそれぞれのタンク出口流量と温度を指定した値に維持することと,できるだけ警報が点灯しないような操作を行うことである.学習ルールの重みの初期値は,パネルの提示関係に対応するものを1.0とした.重みに対する正の報酬は0.5とし,負の報酬は0.3に設定した.

 パフォーマンスによる評価項目では,警報発生時のパネル呼び出し回数,警報点灯時間,出口流量と要求流量との差の時間積分,及び出口温度と要求温度との差の時間積分,バルブ操作回数を用意する.表1は,学習による提示と学習なしによる提示,及び学習提示時における被験者ごとに異なるパネル呼出操作実験での各項目の値を示している.各値は,被験者の平均値(標準偏差)を示している.

 学習による提示では出口流量偏差,温度偏差のいずれも少なく,警報点灯時間,異常時のパネル呼び出し操作数が短いことがわかる.各評価項目について平均値が等しいとする帰無仮説に対してt検定を行ったところ(有意水準5%),異常時のパネル操作数については,帰無仮説は棄却された.また,被験者ごとに異なるパネル呼出操作実験では,学習が進むにつれ被験者のパネル呼出回数は時間の経過とともに増加しなかった(図5).

 運転員の望む情報提示方法を学習することで,運転員の操作負荷が軽減されることが示された.

図1 システム構成

図2 ベイジアンネットワークによるシステム状態階層

図3 初期状態

図4 観測後の状態

図5 提示パネル

表1 実験結果

図6 連続した被験者の学習によるパネル操作回数の時間推移

審査要旨 要旨を表示する

 大規模複雑なシステムにおける運転員の操作エラーは、システムに多大な被害をもたらすため,その防止策を工夫することが求められている.本論文は,人間と機械の有効な協調を実現するための状況適応型プラントヒューマンマシンインタフェースが運転員の負荷を軽減できる可能性を探索するもので、状態認識推論機能と学習機能を備えたインタフェースを用意し,プラント運転員の状態認識過程をベイジアンネットワークを用いて推論するとともに,推論結果と学習を用いて運転員に対応した適切な情報提示を行う方法を創出し、その有効性を検証するために行なわれた実験とその評価結果を取りまとめたもので、全4章から構成されている。

 第1章は研究の背景を述べている.

 第2章は,センサバリデーション部,状態認識部,学習部,情報提示部から成っている、提案するインタフェースのシステム構成について述べている.センサバリデーション部は,プラントでセンサ異常が発生した時,センサ異常情報を警報器のパネルへ提示しセンサ情報を状態認識部へ送信しない役割を有し,センサ異常を検出するため,マルチエージェントシステムによるセンサ故障診断を行うサブシステムである.状態認識部は,畠山の研究を参考にプラント運転員がプラント状態をどう認識しているかを推論し,推論結果より,運転員が考えるタスク目標を導出するサブシステムである.学習部は,Profit Sharingによる運転員に応じて情報を適応提示するための計算を行い,学習の初期には,設計者が妥当と考える推論結果より得られたタスク目標と提示パネルとの対応関係を重みとして反映させ,学習が進むにつれ,運転員が望む提示関係へと変化するようにしているサブシステムである.情報提示部は,運転員の望む情報がどれであるかを知り,学習部で選ばれたルールに対応する行動をもとに設計されたパネル提示を行い,運転員へ提示するパネルとして全体表示チャンネル,警報器,特定化情報チャンネルを用意している.特定化情報チャンネルは,プラント各部の状態をトレンドグラフ等の表現方法で提示し,表示パネルを運転員の認知活動と学習に合わせて切り替える仕組みを内蔵している.

 第3章は,このインタフェースの効果を検証するため行なった実験とその評価について述べている.パネルの学習あり,なし提示の比較,学習によるパネル提示時のシナリオの違いによる比較,被験者のパネル呼出操作により得られた学習ルールの重みを初期設定として順番に次の被験者へ与えた時の被験者のパネル呼出操作の変化について実験を行い、被験者が抱く負荷をNASA-TLXより評価した。その結果,学習ありとなしのパネル提示の比較では,異常時のパネルボタン操作数について統計的に有意な差が現れたこと、重み更新学習では、被験者が操作するにつれ,パネルの操作数は時間の経過とともに継続的には増加しないこと等の結果が得られたことから、学習によるパネル提示調整の効果,このような機能を有するインターフェイスの利用による運転員の負荷軽減の可能性が明らかにされたとしている.

 第4章は結論で以上の結果を要約した後、今後の課題を述べている。

 以上を要すれば、本研究は、運転員の状態認識過程を推論するとともに,推論結果と対応する提示情報の組み合わせを学習するインタフェースを考案して、基礎実験によりこれが運転員のパネル操作負荷軽減に有効であることを示して、複雑なプラントにおける運転員のためのヒューマンマシンインタフェースの設計に貢献する新しい知見を得ており、システム量子工学の発展に貢献するところが少なくない.よって本論文は,博士(工学)の学位請求論文として合格と認められる.

UTokyo Repositoryリンク