学位論文要旨詳細

学位論文要旨


No		129081
著者（漢字）		西山,未央
著者（英字）
著者（カナ）		ニシヤマ,ミオ
標題（和）		輝度勾配に基づく動き場生成と隠れマルコフモデルを用いた動作認識アルゴリズム
標題（洋）
報告番号		129081
報告番号		甲29081
学位授与日		2013.03.25
学位種別		課程博士
学位種類		博士(工学)
学位記番号		博工第7972号
研究科		工学系研究科
専攻		電気系工学専攻
論文審査委員		主査：　東京大学　教授　柴田,直　東京大学　教授　浅見,徹　東京大学　教授　浅田,邦博　東京大学　教授　相田,仁　東京大学　教授　高木,信一　東京大学　准教授　三田,吉郎
内容要旨		要旨を表示する本論文では、動作認識を行うアルゴリズムについて、特徴量抽出プロセス及び抽出された特徴量を隠れマルコフモデルによりモデル化し動作認識を行うプロセスそれぞれに関して2件ずつの新たな手法の提案を行った。特徴量抽出プロセスに関しては、元動画像から動き場マップのシーケンスを抽出する手法について、フレーム画像の輝度勾配の差分マップを用いる手法の提案を行った。1件目の手法においては既存の抽出法を発展させ、より低ノイズな動き場マップを生成することを可能とした。また、2件目の手法に於いては時間軸方向の軌跡情報により重点を置いた新たな始点からの生成法を提案し、ノイズを含む動作サンプルや複数動動作物体を含むサンプルに対して耐性の高い動き場マップ生成の検証を行った。認識プロセスにおけるアルゴリズムについては、隠れマルコフモデルを用いた認識手法に関し、各々の動作モデル単独によりテストサンプルを評価する手法の提案を行い、従来の手法では困難であった``未知の動作パターン"に対する判定を可能とし、更にこれを応用することでより複雑な動作シーケンスをより単純で短い有限の単位動作モデルの組み合わせにより簡単に認識を行う手法について提案を行った。更に、最後の提案手法においては、動き場マップの動き情報の解析のみをもちいて、時空間方向について対象動作領域を自動的に検出しながら認識を行うことで、対象動作の位置やサイズの違いに対して不変的なほか、複数の動作物体の同時認識にも対応した認識アルゴリズムの提案と検証を行い、各々単純な動作サンプルについてのみではあるものの、概して80%以上の認識率によりその効果を確認することができた。
審査要旨		要旨を表示する本論文は,「輝度勾配に基づく動き場生成と隠れマルコフモデルを用いた動作認識アルゴリズム」と題し,ビデオシーケンスから抽出した動き場マップをベースに,その時間変化を隠れマルコフモデルを用いて学習することにより,ビデオに映っている人物の動作認識を行うアルゴリズムに関する研究成果を纏めたもので,全文6章よりなる. 第1章は,序論であり,本研究の背景について議論するとともに,本論文の構成について述べている. 第2章は,「輝度勾配の差分マップを用いた動き場推定アルゴリズム」と題し,輝度勾配の時間変化を用いて精度の高い動き場マップを推定する方法について述べている.これまでは,輝度勾配の閾値処理で得られる縦・横のエッジ情報をもとにブロックマッチングで動き場を求めていたが,本研究では,輝度勾配ではなくその時間変化の値に対して閾値処理を行い,これにより得られる二値データを積分したDirectional Gradient Displacement(DGD)マップでブロックマッチングを行う.その結果,静止背景から発生するノイズを有効に除去できるようになり,高精度な動き場推定が可能となった.動作認識の性能は動き場推定の精度に大きく依存するため,これは重要な成果である. 第3章は,「輝度勾配時間差分の時間軸方向変異に対するハフ変換を用いた動き場推定アルゴリズム」と題し,さらに精度の高い動き場推定の方法を提案している.前章の方法では,画面内に複数の物体が異なる速度で動いている場合,遅い物体ではその動きが検出されないという問題がある.本章ではDGDマップをx - t 平面及びy - t平面上で観察し,物体の動きがこれらの平面上では直線の軌跡を描くことから,ハフ変換を用いて直線の検出を行い,これにより動き場を求める手法を開発した.異なる速度にも柔軟に対応可能で,且つ優れたノイズ耐性を持った動き場推定が可能となった. 第4章は,「隠れマルコフモデルによる対象単位動作の自動検出法及び長期動作シーケンス認識への応用」と題し,特定の単一動作に対し,それに特化して学習した隠れマルコフモデルとその応用について述べている.各モデルは,自分の学習した動作に対する尤度を固有の評価値として保持し,未知の動作に対する尤度をその固有の評価値で割った規格値で評価し,自己モデルに合致するか否かを判断する.これにより,複数の異なる動作が時間的に連続して様々に組み合わされて提示される動作に対しても,基本動作を学習したモデルだけを用いて柔軟に認識できることを示している. 第5章は,「空間分割による対象動作領域自動推定に基づく複数物体の動作認識」と題し,同一画面内で複数の人物が異なる動作をしている場合や,カメラからの位置が異なり人物像の大きさが異なっているといったケースに対しても,柔軟に対応できる新たなアルゴリズムを提案している.システムは,所定の画面内における動作を二つの形式で表現して学習する.Grid Partition表現は,画面のどの位置にどのような動きがあるかをセルに分割してベクトル表現したものであり,一方Motion Clusterマップは,動きが集中している領域をDBSCANでクラスター化して検出・表現したものである.後者で動作の行われている位置の候補を探索し,前者を用いて本当に合致しているか否かを判別する.これによって,複数の人物が同一画面内で異なる動作を行うといった複雑なケースにも,精度よく柔軟に動作認識の出来ることを実験的に示している.これは,重要な成果である. 第6章は結論である. 以上要するに本論文は,ビデオシーケンスに含まれる人物の隠れマルコフモデルを用いた動作認識に関し,輝度勾配の時間変化に基づく動き場推定法を提案し,複数の人物が同時に異なる動作を行う場合にも柔軟に動作認識が可能なシステムを構築してその有用性を実験的に示したものであり,電子工学の発展に寄与するところが少なくない. よって本論文は博士(工学)の学位請求論文として合格と認められる.
UTokyo Repositoryリンク