学位論文要旨



No 116071
著者(漢字) 竹内,敬亮
著者(英字)
著者(カナ) タケウチ,ケイスケ
標題(和) 3次元空間における任意視点画像生成のための光線情報取得に関する研究
標題(洋)
報告番号 116071
報告番号 甲16071
学位授与日 2001.03.29
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第4908号
研究科 工学系研究科
専攻 電子情報工学専攻
論文審査委員 主査: 東京大学 教授 原島,博
 東京大学 教授 今井,秀樹
 東京大学 教授 石塚,満
 東京大学 教授 池内,克史
 東京大学 教授 相田,仁
 東京大学 助教授 相澤,清晴
内容要旨 要旨を表示する

 3次元画像通信やCGの分野で、3次元物体や空間を、そこから発せられる光線の集まりのデータ(光線情報)として表現する手法(光線記述方式)が注目されている。この手法は、実在の対象を計算機内に取り込み、従来のCG手法のような幾何形状モデルを用いずに、様々な方式の3次元ディスプレイ上に、写実性の高い任意視点からの画像を表示するための手段として有効である。さらに、様々な入力手段が利用できるのも本方式の利点であるが、光線情報の圧縮や補間処理、光線情報から任意視点の画像を生成する処理の高速化など、光線記述方式の要素技術の研究の発展のためには、性能評価のための標準となるデータが必要であり、その取得を目的とした標準的なデータ入力方法の確立が望まれる。

 光線情報は、ディスプレイ方式や視点位置に応じて、適切な画像を合成して表示するという利用形態を前提とする。そのため、標準的なデータとして利用するには、光線が誤差なく取得されており、かつ画像生成処理の過程での誤差も生じないことが要求される。本論文では、このような条件を満たす光線情報を取得するためのデータ入力手段についての検討を行なった。

既存の3次元画像入力装置による光線取得

 実在の対象を3次元的に計算機に入力する手段としては、透視投影像(立体を遠近感が出るように2次元平面に投影した画像)を撮影する通常のカメラによる多数の視点での2次元画像の撮影や、レンジファインダによる3次元形状計測が用いられる。このうち、多視点撮影については、光線情報を取得する目的でも既に広く用いられており、撮影された画像情報を光線情報に変換する方法も確立している。しかし、視点の配置方法は様々であり、かつ、それぞれの方式の利点や問題点については、十分な議論がなされているとは言いがたい。そこで本論文では、どのような光線が取得され得るかという観点から、既存の多視点撮影方式の位置付けを行なった。

 一方、レンジファインダに関しては、この装置により得られる距離画像を光線情報に変換する手法がまだ確立されていないことから、本論文にてその手法の検討を行なった。距離画像に特有の性質として、光線情報に変換した際、そのデータが記録される4次元情報空間に、隙間がランダムに発生することが挙げられる。この問題を解決するため、4次元情報空間を2次元画像の集合と見なし、メディアンフィルタによる補間を試み、視覚的に良好な結果を得ることができた。さらに、距離画像を光線情報に変換することで実現できる新たな利用形態として、複数の距離画像のデータ統合や、多視点撮影によって得られたデータとの融合を試みた。

光線情報の標本化に伴う問題点の考察

 光線記述方式においては、各々の光線を、位置および方向を表す計4個のパラメータによって表現するが、計算機上では、これらのパラメータはいずれも離散的な値となる。よって、計算機上で扱われる光線情報は、被写体から発せられる全ての光線ではなく、その一部を標本化した離散的なデータである。一方、3次元画像入力の過程では、4次元情報空間の部分空間にある光線群を画像情報として取り出し、これをディジタル化することで、光線を標本化した離散的なデータを得ている。しかし、既存の3次元入力方式によって標本化される光線は、4次元情報空間のパラメータを離散値とすることで標本化される光線とは異なる。本論文ではこの問題点を指摘し、それが原因で画像生成時に生じる誤差について論じた。その結果、元の画像も正しく復元できない可能性があることが明らかになった。

 この問題に対し、まず、原画像が正確に復元できるための光線パラメータの離散化について検討を行なった。しかしこの場合、光線の位置パラメータを、視点位置の間隔の約1/1000の分解能で離散化する必要があり、わずかなデータを記録するにも膨大なデータ量の情報空間を要するため、効率的でない。そこで、原画像の正確な再現は行なわない代わりに、光線情報から合成される画像の誤差を低減することを目的として、3次元画像情報を離散的な4次元情報空間にマッピングする際の光線の近似法について検討した。その結果、位置パラメータの値が近い光線より、位置パラメータの値が近い光線を用いた近似処理の方が有効であることが判明した。この場合、原画像を正確に復元する場合のような細かい離散化は不要である。ここで得られた結果は、最近傍の光線のみによる近似に限らず、周囲の複数の光線を用いて補間処理を行なう場合にも参考になるものと考えられる。

光線情報の直接取得法の提案と実装

 光線情報の取得時と記録時で標本化される光線が異なるという、既存の3次元入力方式の根本的な問題を解決するため、離散的な4次元情報空間と標本点分布が同じになるような光線取得方式(光線の直接取得法)について検討を行なった。現状では、平面ディスプレイに限定した光線情報の直接取得の手段は既に存在するが、全方向の光線の直接取得の方法は確立されていない。そこで本論文では、光線情報が本質的に被写体の正投影像(大きさが奥行きによって変化しないように投影した画像)の集まりであることに着目し、テレセントリックレンズを用いて多数の方向から正投影像を撮影することにより、物体から全方向に発せられる光線を直接取得する方法を提案した。予備実験として、テレセントリックレンズにより多数の方向から物体の正投影像を撮影し(図1)、これを用いて物体を任意の視点から透視投影で見た画像の合成を行なった(図2)。その結果、本手法の有効性が確認された。

 さらに、上記の原理に基づき、光線情報を高い精度で直接取得するための撮像装置を開発した。この装置は、図3に模式的に示すように、物体(剛体に限定)を計算機からの制御によって水平・垂直方向に回転させ、固定されたテレセントリックレンズ付きカメラを用いて、多数の方向からの正投影像を自動的に撮影する。これを用いて撮影実験を行なうとともに、誤差の計算方法と補正方法の検討、誤差の許容量の計算、実現可能な角度分解能に関する検討も行なった。

 本装置は、物体を0.003°単位で回転させることができるが、カメラの解像度が有限であり、微小な回転ではその効果が正投影像に現れないため、実質的な最小角度分解能は0.003°より大きく、現状では0.09°となっている。角度分解能を0.09°として取得したデータを用いると、横320画素以内、水平画角30°以上の任意視点画像の生成の際、画像の貼り合わせによる近似を行なわずに処理されるため、歪みのない画像を得ることができる。図4は、角度分解能を0.9°(予備実験の段階とほぼ同等な値)と0.09°に設定して正投影像を多数の方向から撮影し、それぞれの正投影像群を用いて、任意の視点から見た透視投影像を合成した結果である。この結果によると、角度分解能0.9°のデータから合成した画像は正投影像を貼り合わせたものになり、その境界付近が不連続になる歪みが見られるが、0.09°の場合にはこのような歪みは生じていない。なお、正投影像撮影用のカメラの画素数(現在は640×480画素)が向上すれば、光線情報の角度分解能も向上するため、より画素数の多い画像や画角の狭い画像を、歪みを生じることなく生成することが可能になる。

 撮像装置の誤差に関しては、レンズ歪み、および図3におけるカメラとターンテーブルの位置関係の誤差について検討を行なった。後者の誤差では、水平に回転するターンテーブルの傾きが特に問題となることから、その許容量を求めた結果、正投影像において回転軸の傾きが設計上の位置に対して0.047°以下であれば、誤差の影響を無視できることが判明した。また、上記の誤差の影響が無視できない場合の補正も行なったが、現状では、補正を行なわなくても、生成された画像に視覚的な影響はほとんど現れていない。しかし、これはカメラの解像度の限界のためと考えられ、カメラを高解像度化した場合には、誤差を考慮した処理が必要である。

結論

 本論文では、3次元空間における任意視点画像の合成のための光線情報を、既存の3次元入力手段によって取得する場合の問題点を明らかにし、その解決のため、テレセントリックレンズを利用した光線情報の直接取得方式の提案および実装を行なった。本手法を用いると、光線情報を誤差なく取得し、かつ歪みのない任意視点画像を生成することが可能になる。そのため、光線記述方式に関する様々な要素技術の研究の上で、標準となるデータを取得するのに有効であると考えられる。

図1:テレセントリックレンズにより撮影した正投影像の例

図2:多数の正投影像を用いて合成した透視投影像

図3:撮像装置の模式図

図4:角度分解能の異なる2種類の正投影像群を用いて合成した透視投影像の比較

審査要旨 要旨を表示する

 本論文は、「3次元空間における任意視点画像生成のための光線情報取得に関する研究」と題し、あらゆる3次元画像を統一的に扱う3次元統合情報環境において、3次元空間情報を記述し、視点位置や表示装置の形状に応じて適切な画像を合成するために必要な光線情報を取得する手法について論じたものであって、全体で7章からなる。

 第1章は「序論」であり、現状での3次元画像情報の取得方法の多様性と、3次元画像を光線として記述する手法に関する技術的課題を踏まえ、標準的な光線情報取得方式の必要性とそれが満たすべき条件について論じ、本論文の背景と目的を明らかにしている。

 第2章は「光線による3次元空間情報の記述」と題し、3次元情報を光線の集合として記述する手法に関するこれまでの成果を概観している。具体的には、まず、光線として記述する考え方の登場の背景、および具体的な光線の記述方法を明らかにしている。次いで、代表的な3次元入力手段である多視点撮影について取り上げ、光線情報として記録するための手順を示すとともに、第4章での議論の準備として、視点配置の観点から既存の多視点撮影方式の位置付けを行なっている。

 第3章は「距離画像からの光線情報の取得」と題し、既存の3次元入力手段の一つである3次元形状計測装置によって得られる距離画像(物体の形状と表面色の情報)を、光線情報として記録するための方法について論じている。また、距離画像を光線情報として記録することで実現できる新たな利用形態として、複数の距離画像どうしの統合や、多視点撮影によって得られた画像と距離画像の融合処理を試みている。

 第4章は「3次元情報の光線記述における標本化の影響」と題し、光線情報の取得および記録の際に離散的なデータとして扱うことによって生じる問題点について論じている。具体的には、第2章および3章で論じた既存の3次元入力手段によって取得したデータと、光線情報が格納される4次元情報空間を比較して、両者が3次元空間内に連続的に分布する同じ光線群に対して異なる標本化を行なったものであることを示し、この影響で任意視点画像の合成結果に視覚的な歪みが生じる可能性があることを明らかにしている。

 さらに、任意視点画像の画質の改善を目的として、元の画像情報を損失なく記録するような4次元情報空間の離散化や、画像情報を離散的な4次元情報空間に格納する際のデータの近似方法について検討を行なっている。

 第5章は「正投影像を利用した光線情報の直接的な取得」と題し、第4章で論じた問題点の根本的な解決のために、連続的に分布する光線群を4次元情報空間と同じ形で標本化するように光線情報を取得すること(光線情報の直接的な取得)を考え、特に任意の方向から対象を眺めた画像を生成するための光線情報の直接的な取得法の実装について検討を行なっている。具体的には、光線情報が被写体の正投影像の集合であるという性質に着目し、従来のような透視投影での画像撮影ではなく、正投影での画像撮影が可能なテレセントリックレンズを用いて、物体を多数の視点から撮影する手法を提案し、その有効性を実験的に示している。

 第6章は「テレセントリックレンズを用いた物体全周撮像システム」と題し、第5章で提案した原理に基づいて、テレセントリックレンズにより、物体の任意視点画像の合成に必要な光線情報を、高い精度で自動的に取得する装置の開発を行なっている。また、本装置で得られるデータと理想的な光線情報との誤差について検討を行ない、その要因となるテレセントリックレンズの歪みや、全周撮影のために物体を回転させる機構とカメラとの位置関係の誤差について、計算法および補正法を示している。さらに、構築した装置によって得られる光線情報を用いると、歪みのない任意視点画像が合成できることを、実験によって示している。

 第7章は「結論」であり、本研究で得られた成果をまとめるとともに、現状での課題と将来の展望について述べている。

 以上を要するに、本論文は、3次元統合情報環境において任意視点空間情報を記述するために必要な光線情報の取得を目的として、光線記述における標本化の影響などの基礎検討を行うとともに・距離画像や正投影像を利用した新たな光線情報の取得法を提案して実装したものであって、今後の電子情報通信工学の進展に寄与するところが少なくない。

 よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク