学位論文要旨



No 122264
著者(漢字) 山野辺,夏樹
著者(英字)
著者(カナ) ヤマノベ,ナツキ
標題(和) 状態行動地図を用いた複数行動則の統合による組立動作生成
標題(洋)
報告番号 122264
報告番号 甲22264
学位授与日 2007.03.22
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第6469号
研究科 工学系研究科
専攻 精密機械工学専攻
論文審査委員 主査: 東京大学 教授 新井,民夫
 東京大学 教授 木村,文彦
 東京大学 教授 佐藤,知正
 東京大学 教授 浅間,一
 東京大学 助教授 横井,浩史
内容要旨 要旨を表示する

 産業用ロボットの多機能・高機能化が進み,現在は人手で行われているような複雑な組立作業を実現することが可能となってきた.しかしながら,製造現場においてロボットによる組立作業の自動化はほとんど進んでいないのが現状である.その理由の一つとして,組立作業における動作設計の困難さが挙げられる.

 組立とは複数の部品を結合していく作業であり,作業中に環境との接触を伴う作業である.そのため,組み付ける部品間の相対的な位置・姿勢誤差が大きな問題となり,単なる教示動作の繰り返しでは実現することが困難である.過大な接触力の発生を避け,位置決め誤差などの不確定性を吸収しながら作業を実現するためには,環境との接触力を上手く利用する必要があり,力制御が有効である.力制御では接触力に応じてロボットの挙動が修正される.そのため,適切に作業を達成するためには,接触力と挙動との関係を定める力制御パラメータを適切に設計する必要がある.しかしながら,設計すべきパラメータは作業内容や作業環境に大きく依存するため,一般的なさまざまな作業に対してパラメータを系統的に設計する手法は確立されていない.そのため現在は,設計者がまず作業内容を理解し,その理解や経験に基づき試行錯誤的に作業を繰り返してパラメータの調整を行っているのが現状である.さらに,自動化が要求されている複雑な組立作業では,作業中に力制御パラメータを適切に切り替える必要がある.この場合,パラメータの切り替え点をも含めて調整を行なわなければならず,膨大な労力が必要となる.ロボットによる組立作業の自動化を進めるために,複雑な組立動作を効率的に設計することのできる方法論の構築が要求されている.

 複雑な組立作業も比較的簡単なサブタスクの組み合わせと考えることができ,倣いや挿入動作などの基本的な動作を上手く利用することで複雑な組立作業を達成することが可能である.本論文では,基本動作を実現するための行動則を複数組み合わせて上手くつなぎ合わせることにより,複雑な組立作業を実現する動作を効率的に生成することを目的とする.ここで,組立動作を実現するための行動則は,作業状態に応じた力制御パラメータの系列として表現される.

 本論文では,対象作業に適用する行動則は設計者が定めることとする.このとき,設計者が行動則の適用状態を明確に設定することは,作業中のロボットの手先位置・姿勢の推定誤差や力センサの大きなノイズのため困難である.また,適用する行動則全体が対象作業に対して有効に働くとは限らず,行動則間での競合や行動則を切り替える際に振動により作業が失敗する可能性もある.適用条件が不確実であり,また不適切な部分が存在し得る複数の行動則を適切に組み合わせ,不都合な部分を修正することにより,作業全体として整合性の取れた動作を生成することが必要である.

 本論文では,以下の2項目を実現する.

(1) 複数行動則の統合による動作生成手法の構築

(2) 行動則統合手法の組立作業への適用・検証

 行動則の統合においては,複数の行動則を統一的に取り扱うことができるように,状態行動地図という簡便な表現方法を用いてロボットの動作を表現することとする.状態行動地図は,離散化された各作業状態において選択すべき行動を記述したルックアップテーブルである.各行動則は,適用される作業状態に対して選択すべき力制御パラメータの値を書き込むことにより,状態行動地図上に表現される(Fig. 1).

 適用した行動則を利用して効率的に対象作業を実現する動作を生成するために,行動則が適用されている状態において選択し得る行動を適用された行動則に則した行動にのみ限定した上で,対象作業全体の行動方策の探索を行う.ここで,適切な行動方策は,各状態においてその状態から作業達成までに得られる報酬の期待値を表す価値関数V(s)を推定することにより獲得することができる.効率良く対象作業を達成することのできる動作が適切な動作であるので,行動を選択するたびに選択した行動に要した時間に応じた負の即時報酬を与えることとする.

 作業失敗状態の選定は行動方策の探索と同時に行う.失敗状態は適用された行動則に則した行動を選択するだけでは失敗状態を遷移するのみで作業の達成状態に到達することができない状態として定義できる(Fig. 2).毎回の行動ごとに負の報酬が与えられるため,状態遷移を繰り返す場合,状態価値関数V(s)が小さくなっていく.そこで,状態価値関数V(s)の減少を利用して失敗状態を選定する.

 最終的に,選定した失敗状態において部分的に行動を修正する.適用した行動則に則した行動方策の探索,失敗状態の選定,失敗状態における行動の部分的な修正を,失敗状態が存在しなくなるまで繰り返すことにより,作業全体として整合性のある動作を獲得する.

 ここで,状態価値関数V(s)は推定作業時間と考えられるので,作業効率を考慮した失敗状態の選定および行動の修正が可能である.

 次に,提案する複数行動則の統合手法を組立作業に適用するため,組立動作を表現することのできる状態・行動空間を設定し,その空間における行動則の表現方法を定義した.また,基本動作を実現するための適切な行動則を獲得する手法を提案した.

 組立動作は,ロボット手先の位置・姿勢,環境からの反力,ロボット手先のダイナミクス(つまりそのときの力制御パラメータ値)の3つの状態変数で表現することができるとし,対象作業を表現する状態空間は,適用された行動則を表現する状態空間の合成として定義することとする.

 また,有効な行動則の獲得に関しては,以下の2つの方法が考えられる.

 ・パラメータの最適化手法を用いた方法

 ・人の実演作業から抽出する方法

 倣い動作や挿入動作といった基本的な動作は,時不変の力制御パラメータで実現することが可能であるため,力制御パラメータの最適化を行うことにより有効な行動則を獲得することが可能である.ここで,産業的には作業効率の向上が重要視される.本論文では実用的な行動則を得るために,作業効率を考慮した力制御パラメータの最適化手法も提案した.作業効率は理論的に求めることが困難であるため,作業を繰り返し行い,その結果を用いて探索的に適切なパラメータを獲得する(Fig. 3).この手法は制約条件つきの非線形最適化問題として定式化することができ,評価値の微分値を利用しない直接探索手法である滑降シンプレックス法に局所解回避のために焼きなまし法を組み合わせた手法を用いてこの最適化問題を解くことで適切な力制御パラメータを獲得する.本論文では,パラメータを評価する際の安全性を考慮して,シミュレーションベースで最適化を行うこととし,LMSDADSおよびMATLAB Simulinkを組み合わせて作成した作業シミュレータを用いた.

 Peg-in-Hole作業およびクラッチ嵌合作業を対象として,基本的な動作である挿入動作ならびに探索動作を実現する適切な行動則を,提案する最適化手法を用いて獲得した.各々,作業効率を約50%および約20%向上させることのできる有効な行動則を獲得できることを確認した.

 また,作業中に力制御パラメータの切り替えが必要な複雑な動作に関しては,人の実演作業データから基本動作を抽出することとする.実演作業データから力制御パラメータの時系列データを推定し,その時系列データを解析することにより,対象動作を時不変の力制御パラメータで達成することのできる基本動作に分割する.抽出した各基本動作を実現する有効な行動則は,提案した作業効率を考慮したパラメータ最適化手法を用いて獲得することとする.

 本論文では,乾電池装填作業を対象として基本動作の抽出を行った.乾電池装填作業は,環境にバネ性があるため,作業中に環境の変化に応じて手先ダイナミクスを変化させる必要がある.作業を達成するためには,乾電池先端をバネに当てるための探り動作,バネを押し縮める動作,姿勢を変化させ乾電池をボックス内に固定する動作などいくつかの基本動作が存在する.人の実演作業から,位置・力データを獲得し,近似離散時間モデルを用いた逐次最小二乗法により力制御パラメータの推定を行った.力制御パラメータの変化および位置・力データの変化を解析し,一連の動作の基本動作への分割,および各基本動作の適用状態の選定を行う.

 最後に,提案した複数行動則統合手法の有効性を検証するため,クラッチ嵌合作業(Fig. 4)に対してシミュレーション実験を行った.クラッチ嵌合作業は,中心ずれと位相ずれを修正しながら一段ずつ嵌め合わしていく作業であり,挿入動作と探索動作を上手く切り替えることにより,作業を実現することができる.本論文では,パラメータ最適化手法で獲得した挿入動作ならびに探索動作を統合することにより,適切な動作を生成することを目指した.Q学習を用いて両行動則の統合を行い,明確には検出することが困難である歯の噛み合った状態を認識し,挿入と探索動作を適切に切り替えながら作業を実現する動作が獲得されることを確認する.

Fig. 1 Application of multiple policies to a state action map.

Fig. 2 Failing states detection.

Fig. 3 Optimization method for force control parameters by considering cycle time.

Fig. 4 Clutch assembly.

審査要旨 要旨を表示する

 本論文は「状態行動地図を用いた複数行動則の統合による組立動作生成」と題し,全6章からなる.本論文では,複雑組立作業の動作設計を効率的に行うことを目指し,作業達成に有効な複数の行動則ならびに作業知識を統合することにより動作を生成する手法を提案している.

 組立作業は環境との接触を伴う作業であるため,接触力に応じてロボットの挙動を修正する力制御により自動化が行われる.力制御を用いて適切に作業を達成するためには,接触力と挙動との関係を定める力制御パラメータを適切に設計する必要があるが,設計すべきパラメータは作業内容や作業環境に大きく依存するため,一般的なさまざまな作業に対してパラメータを系統的に設計する手法は確立されておらず,試行錯誤的な調整が行われているのが現状である.また,複雑形状部品の組立や弾性環境に対する組み付けなどの複雑な組立作業では,作業中に手先の動特性を上手く切り替える,つまり力制御パラメータ値を切り替える必要があるため,切り替え条件をも含めてパラメータを設計する必要があり,試行錯誤的な調整では膨大な労力が必要となる.組立作業の動作設計を効率的に行う手法の構築が強く望まれている.

 第1章では,研究の背景と目的を述べた.複雑な組立作業も,挿入動作などの簡単な基本動作を組み合わせることで実現可能であると考えられる.また動作設計を行う際には,類似作業の動作プログラムや作業に対するknow-howなど有効な行動則や作業知識がさまざま存在する.本論文では,このような行動則および作業知識を統合することにより,組立動作を効率的に生成する手法の構築を目的とした.

 第2章では,複数行動則の統合手法を提案した.行動則や作業知識は設計者が選定するため,その適用条件が不明確であったり,誤りを含む場合がある.また,作業知識は言葉ベースのknow-howなど,多様な形式で存在し得る.まず,多様な形式の行動則および作業知識を統一的に取り扱うことができるように,状態行動地図という簡便な表現形式を用いてロボットの動作を表現することとした.状態行動地図は離散化された状態において選択すべき行動を記述したルックアップテーブルであり,行動則は状態に応じた行動として地図上に書き込む.効率的に動作生成を行うため,ロボットの選択できる行動を適用した行動則に則した行動にのみ限定して,対象作業全体の行動方策の探索を行い,同時に適用した行動則に従うだけでは作業に失敗する状態(失敗状態)の選定を行う.行動方策の探索の際,選択した行動に要した時間に応じた負の即時報酬を与えることとし,失敗状態の選定は,失敗状態における状態価値関数の減少を利用して行うこととする.失敗状態における行動則を部分的に修正することで,作業全体として整合性の取れた動作を生成する.

 第3章では,提案した複数行動則の統合手法を組立作業に適用するため,組立動作を表現する状態・行動空間を定義し,行動則および作業知識の地図上での表現方法について説明した.組立動作を表現する状態変数としては,ロボットの手先位置・姿勢,反力,手先の動特性といった可観測の情報のみを考慮することを示した.また,行動空間を設定するため,力制御則について概観し,実用性の観点からダンピング制御則を組立作業に有効な力制御則として本論文では取り扱うことを示した.

 第4章では,有効な行動則を獲得する手法について提案した.時不変の力制御パラメータで実現可能な基本動作については,パラメータの最適化手法を用いることにより適切な行動則を獲得できることを示した.作業効率を考慮したシミュレーションベースの最適化手法を提案し,提案手法を用いて挿入動作および探索動作の行動則を獲得した.それぞれ,作業効率を向上させる有効な行動則を獲得した.また,作業中に力制御パラメータの切り替えが必要な動作については,人の実演データから行動則を抽出する方法を示した.実演データから力制御パラメータの時系列データを推定し,隠れマルコフモデルを用いて組立動作を解析することにより,対象動作を一定の力制御パラメータで達成可能な基本動作に分割する.乾電池装填作業を対象として,上記の手法を用いて複雑な組立動作を複数の基本動作に分割可能であることを示した.

 第5章では,複数行動則統合手法の有効性を検証するため,クラッチ嵌合作業を対象としてシミュレーション実験を行った.クラッチ嵌合作業は,探索を行いながら一段ずつ歯を嵌め合わしていく作業であり,挿入動作と探索動作から成る.提案手法を用いて,第4章で獲得した挿入動作および探索動作を統合した.単純にこれらの行動則を合わせると,クラッチの歯が噛み合っていない状態で挿入が行われ,過大な接触力により作業が失敗に終わる場合が多い.一方,提案手法を用いて生成した動作では,作業状況に応じた適切な行動則が選択され,クラッチプレートの初期配置などの不確定性にも対処しながら滑らかな嵌合が行われることを確認した.提案手法によって,行動則を適用した際に生じる予期せぬ失敗状態を修正し,有効な動作を生成できることを示した.

 以上のように,本論文においては,動作生成の際に有効ではあるが,多様な形式で存在する上,誤りや競合が存在し得る複数の行動則および作業知識を統合する手法の提案が行われ,組立作業に対する有効性が示された.これはロボットマニピュレーションの分野において価値ある成果であると言え,工学全般の発展に大きく寄与するものである.

 よって本論文は博士(工学)学位請求論文として合格と認められる.

UTokyo Repositoryリンク