学位論文要旨詳細

学位論文要旨


No		123950
著者（漢字）		神崎,秀
著者（英字）
著者（カナ）		カンザキ,シゲル
標題（和）		ヒューマノイドの行動指標評価機構に基づく全身行動の生成と制御
標題（洋）
報告番号		123950
報告番号		甲23950
学位授与日		2008.03.24
学位種別		課程博士
学位種類		博士(情報理工学)
学位記番号		博情第195号
研究科		情報理工学系研究科
専攻		知能機械情報学専攻
論文審査委員		主査：　東京大学　教授　稲葉,雅幸　東京大学　教授　竹内,郁雄　東京大学　教授　佐藤,知正　東京大学　教授　中村,仁彦　東京大学　教授　國吉,康夫
内容要旨		要旨を表示する第1章「序論」では,等身大ヒューマノイドの全身行動生成・制御研究の現状とその問題点について述べる. ヒューマノイドの応用プロジェクトが一貫して目指しているものは,人間の代替労働九特に単純肉体労働の担い手としてのヒューマノイドである.代替労働力としてヒューマノイドを見た場合,ヒューマノイドが他のロボットと比較して優位な点は,人間と同様な体躯を持っていることによる多様な全身運動を生かし,人間のために整備されたインフラ内を人間に違和感を与えない形で作業し,移動し,対話することのできる可能性を秘めている点である. ヒューマノイドに与えられるタスクが多種多様なものである以上,ハードウェア設計をある特定のタスクに最適化したものとすることは困難である.それ以上に,ヒューマノイドには人間に似せた姿形というデザイン上の大きな制約が課されているがために,機構および駆動力に関して厳しい制限が生じる.単純作業を繰り返す工場内の産業用ロボットの場合,対象とするタスクに最適化されたハードウェア設計がなされ,結果としてそのタスクに対してどの程度の性能を発揮するかはハードウェアの完成段階で決定される.他方,ヒューマノイドに作業タスクを遂行させる場合,そのタスクに対してどの程度のパフォーマンスを出せるかということは,自明ではない.そのタスクが求める遂行精度を満たしつつ,ハードウェアの制約の範囲内で可能な限り効率的に行動を継続することが求められる.現状のヒューマノイドはそれを実現するための十分に一般的な枠組みを持たないのが現状である.この「身体能力の限界を考慮したタスクの実行」という点を明示的に考慮し,一般化できなければ,ヒューマノイドの潜在的な運動能力は設計者の制限の範囲内でアドホックに規制されてしまい,タスクの達成精度や速度があとどの程度向上できる余地があるのかという点を定量的に評価できるようにならない.このことは汎用作業移動機械を指向するヒューマノイドにおいては本質的な問題である. 第2章「行動指標評価機構に基づく全身行動の生成と制御」では,第1章で述べた問題点を解決するための具体的方策として本研究が提案する,身体能力余裕度と運動目標可変性を調停する行動指標評価機構についてその全貌を述べる. 多くのタスクにおいて目標を本質的に変更せず,調節可能な量を持つことをタスクの「運動目標可変性」,前述の実世界における身体的制約から来る行動の諸制約に対して,どの程度の余裕を見ているかという量を「身体能力余裕度」と定義する.ヒューマノイドの全身行動生成及び制御において,タスクの本質的な目標を保ったままヒューマノイドが可能な限りの運動パフォーマンスを発揮し行動を実行するためには,運動目標可変性と身体能力余裕度のトレードオフを調節する仕組みが不可欠である.このトレードオフを調節する機構を「行動指標評価機構」と定義する.本研究では行動指標評価機構の構成法およびその実装について議論し,ヒューマノイドの全身行動の生成と制御においてこの機構が有効に機能することを示す.ここで行動指標評価機構の構成法として,具体例を挙げ考察を進める,前述したように,行動指標評価機構は以下の2つの側面から構成される. 身体能力余裕度ヒューマノイドが持つ運動性能の諸側面において,その限界値からの距離の大きさとして定義されるもの. 運動目標可変性ヒューマノイドに与えられたタスクにおいて,達成目標を変更しない範囲で変更可能なパラメータ群として定義されるもの. このうち身体運動余裕度は,次の3つが本質的制約として挙げられる. ■関節角度余裕度Aθ(margin) ●関節負荷余裕度Ar(margin) ●転倒安定余裕度A(stability)(margin) それぞれの余裕度の具体的定式化については第3章で述べる.一方で運動目標可変性はタスクによって大きく形を変える,一例として平地での歩行移動を挙げると,移動時に変更可能なパラメータとしては, ●腰高さB1(margin) ●歩幅B2(margin) ●一歩当たりの時間B3(margin) ●両脚支持期と片脚支持期の時間比B4(margin) ●足上げ高さB5(margin) 等が挙げられる.これらのパラメータは平地での歩行移動において,ある到達地点に移動することが目標である場合においては,変更が可能な値である.もちろん,歩幅が0[m]の場合移動が不可能であるし,足上げ高さが0[m]である場合は床との干渉により移動が困難であるなど,自由に変更が可能であるわけではなく変更可能な範囲は制限されていると考えられる,しかしながら,例えば歩き方を人間に似せたいなどの可能な限り実現したい副次的目標がある場合,「腰高さはなるべく高く,歩幅は大きく,両脚支持期の時間がなるべく短いほうがよい」などと,これらのパラメータに対してどうあったほうが望ましいかという方向決めが課される場合が多い. 一方でこれらのパラメータは前述した余裕度とは競合関係にある.腰高さを高く保とうとすれば,膝の伸展により関節角余裕度は減少し,両脚支持期を短くすることはZMPの急速な移動を招くために,脚部関節の急加速による関節負荷余裕度の減少やふらつきによる転倒安定余裕度の減少が想定される. このタスクの副次的目標を,各余裕度を最低限度保ちながら可能な限り満たすごとがタスク実行時に求められるものである.この調停機構を本論文中では行動指標評価機構と表現することとする.行動指標評価機構は形式的には, Ψ=∫t0{Aθ(margin)+Ar(margin)+A(stability)(margin)+F(B1(margin),B2(margin),...,BN(margin))}dt (1) によって計算されるΨを最大化する機構として表現される.ただしF(Bmargin1,Bmargin2,…,BmarginN)は,運動目標可変性を表すパラメータ群によって記述され,副次的目標の達成度に応じて高い値を示す関数である. 本論文では,この行動指標評価機構の一般的記述および実装法について中心的に議論する.具体的行動例に即して,その行動における行動指標評価機構の構成について議論する. 第3章「行動指標評価のための分岐多リンク系運動計算」では,行動指標評価機構構築のための基盤となる分岐多リンク系運動計算の詳細について述べる. 第4章「行動指標評価機構による全身行動生成・制御システム」では,構築した行動システムを検証するために用いた実験環境の詳細について述べる. 第5章「既知環境における全身行動の生成と制御」では,タスク達成に必要な環境についての情報がすべて既知である状況下における全身行動の生成および制御手法について述べる.平地歩行,階段昇降,椅子への着座,椅子からの立ち上がりについてそれぞれの行動における身体能力余裕度と運動目標可変性の関係について議論し,行動指標評価機構の構成法について述べる. 第6章「未知パラメータを含む環境における全身行動の生成と制御」では,摩擦力や操作対象物体の運動特性等,タスク達成に必要な環境についての情報が部分的に未知である状況下における全身行動の生成および制御手法について述べる.未知重量物体の引っ張り行動,未知形状路面の足探り移動行動についてそれぞれの行動における身体能力余裕度と運動日標可変性の関係について議論し,行動指標評価機構の構成法について述べる. 第7章「変動環境における全身行動の生成と制御」では,タスク遂行中に環境そのものが変動する状況において,環境の変化に適応し行動を実現するための全身行動の生成および制御手法について述べる,変化する環境への反射的対応と次の環境変化に対する予測の2つの側面からのアプローチを提案し,変動路面でのバランス維持行動,衝突時の身構え行動,転倒時の踏み換え行動について,それぞれの行動における身体能力余裕度と運動目標可変性の関係について議論し,行動指標評価機構の構成法について述べる. 第8章「結論」では,これまで各章で述べた内容をまとめて本研究を総括し,今後の等身大ヒューマノイドの全身行動の生成・制御研究の発展の方向性について述べる.提案する手法により,異なるヒューマノイドであっても,実現したいタスクとそのタスクにおける可変なパラメータを与えることによって,ヒューマノイドの身体能力に応じた全身行動時系列を自動的に生成することが可能となった,即ち従来行動設計者がアドホックに行っていたハードウェアごとの行動記述制約を定量的に評価することが可能となり,諸制約を満たす行動生成のための試行錯誤に必要とされる時間および手順が短縮されることを示したと言える.
審査要旨		要旨を表示する本論文は,「ヒューマノイドの行動指標評価機構に基づく全身行動の生成と制御」と題し,人間型ロボットであるヒューマノイドにおける全身行動の生成法と制御法の問題に関して,ロボット身体の性能によって決まる余裕度と行動目標の変更可能性の両方を行動指標として考慮する評価機構について論じ,既知環境のみならず変動する環境場面での全身行動においてその行動指標評価構造をどのように構成し,行動生成と制御を行うかを実験を通して示したものであり,8章からなる. 第1章「序論」では,等身大ヒューマノイドの全身行動生成・制御研究の現状とその問題点について述べている.ヒューマノイドに与えられるタスクが多種多様なものである以上,ハードウェア設計をある特定のタスクに最適化したものとすることは困難である.そのタスクが求める遂行精度を満たしつつ,ハードウェアの制約の範囲内で可能な限り効率的に行動を継続することが求められる.この「身体能力の限界を考慮したタスクの実行」という点を明示的に考慮し,一般化できなければ,ヒューマノイドの潜在的な運動能力は設計者の制限の範囲内でアドホックに規制されてしまい,タスクの達成精度や速度があとどの程度向上できる余地があるのかという点を定量的に評価できるようにならない.これは汎用作業を行いながら移動可能な機械であるヒューマノイドにおいては本質的な問題であると指摘している. 第2章「行動指標評価機構に基づく全身行動の生成と制御」では,1章で述べた問題点を解決するための具体的方策を示している.多くのタスクにおいて目標を本質的に変更せず,調節可能な量を持つことをタスクの「運動目標可変性」,実世界における身体的制約から決まる行動の諸制約に対して,どの程度の余裕を見るかという量を「身体能力余裕度」と定義している.ヒューマノイドの全身行動生成及び制御において,タスクの本質的な目標を保ったままヒューマノイドが運動パフォーマンスを発揮し行動を実行するには,運動目標可変性と身体能力余裕度のトレードオフを調節する仕組みが不可欠である.このトレードオフを調節する機構を「行動指標評価機構」と定義している. 第3章「行動指標評価のための分岐多リンク系運動計算」では,2章で提案した行動指標評価機構を構築するための基盤となる分岐多リンク系運動計算の詳細について記述し,動力学的解析に基づいて時系列行動評価,転倒安定性評価,身体能力余裕度の定式化を行っている. 第4章「行動指標評価機構による全身行動生成・制御システム」では,構築した行動システムを検証するために用いた実験環境の詳細について述べている.転倒実験が可能な小型のヒューマノイドと等身大ヒューマノイドの両方を実験用ヒューマノイドとして用いており,両方に共通の行動生成・制御システムを構成するための実験環境を構成している. 第5章「既知環境における全身行動の生成と制御」では,タスク達成に必要な環境についての情報がすべて既知である状況下における全身行動の生成および制御手法について述べている.平地歩行,階段昇降,椅子への着座,椅子からの立ち上がり動作をとりあげ,それぞれの行動における身体能力余裕度と運動目標可変性の関係について論じ,行動指標評価機構の構成法と行動実験の詳細について述べている. 第6章「未知パラメータを含む環境における全身行動の生成と制御」では,摩擦力や操作対象物体の運動特性と,タスク達成に必要な環境についての情報が部分的に未知である状況下における全身行動の生成と制御の手法について述べている.未知重量物体の引っ張り行動,未知形状路面の足探り移動行動について身体能力余裕度と運動目標可変性の関係を論じ,その行動指標評価機構の構成法を示している. 第7章「変動環境における全身行動の生成と制御」では,タスク遂行中に環境そのものが変動する状況において,環境の変化に適応し行動を実現するための全身行動の生成および制御手法について述べている.変化する環境への反射的対応と次の環境変化に対する予測の2つの側面からのアプローチを提案し,変動路面でのバランス維持行動,衝突時の身構え行動,転倒時の踏み換え行動について,それぞれの行動における身体能力余裕度と運動目標可変性の関係について議論し,行動指標評価機構の構成法を示している. 第8章「結論」では,各章で述べた内容をまとめつつ本研究を総括し,ヒューマノイドにおける全身行動の生成と制御研究における今後の発展方向について述べている. 以上,これを要するに本論文は,身体が異なるヒューマノイドであっても,実現したいタスクとそのタスクにおける可変なパラメータを与えることで,身体能力に応じた全身行動時系列を自動的に生成することが可能となり,人が実機実験を通して試行錯誤していたレベルから試行錯誤に必要となる時間および手順を短縮できる全身行動生成とその制御が可能であることを示した論文であり,知能機械情報学上貢献するところ少なくない.よって本論文は博士(情報理工学)の学位請求論文として合格と認められる.
UTokyo Repositoryリンク