審査要旨 | | 本論文は「手書き数字認識の高精度化に関する研究」と題し,今後のヒューマンインタフェース技術において重要な位置を占めると考えられる文字認識技術について,手書き数字認識の高精度化の観点から行った一連の研究を纒めたもので,7章よりなっている。 第1章は「序論」で,本研究の背景について述べ,本研究の目的を明らかにすると共に,本論文の構成について述べている。 第2章「従来の構造解析法(位相構造化法)による認識」では,構造解析法に属する手法の中で,変形・雑音の吸収が容易な方法として位相構造化法を取上げ,認識方式としての概要,達成水準を述べ,構造解析法に共通する問題点と限界を明らかにしている。 第3章「距離関数の学習方法」では,距離関数の新しい学習方法として判別分析を用いる-LDA(Learning by Discriminant Analysis)法-を提案し,その性質,効果等について論じている。LDA法は,重み付きユークリッド距離,2次識別関数,修正2次識別関数を原距離関数とし,各カテゴリにおいて,着目カテゴリに属するパタンと,着目カテゴリに誤った,もしくは誤りそうになったパタン(ライバルパタン)との間で線形判別分析を施して得られる判別関数を原距離関数に重畳することによりパラメータを学習する。学習の効果として,参照ベクトルは,着目カテゴリとライバルパタンとを最適に分離する方向に移動すること,重み付きユークリッド距離に適用した場合には,特徴間に相関が存在する場合にも適切な形でカテゴリ境界を求めうること,2次識別関数,修正2次識別関数に適用した場合には,特徴が正規分布に従わない時の悪影響が軽減されうることを明らかにしている。 第4章「学習形距離関数による手書き数字認識」では,手書き数字・カナなどのパタン整合法による認識に相応しい特徴抽出法を提案し,前章で提案しているLDA法について,その認識精度の到達点を明らかにするとともに,第2章で述べている位相構造化法と認識精度,処理量,所要メモリ量などに関する比較を行い,提案手法の有効性を示している。 第5章「筆記個人性の検証」では,判読し難い文字に遭遇した時には,他の文字を見て判断するという人間の読取動作と類似の処理を,文字認識においても実現することを目的として,筆記個人性の抽出と認識への応用について論じている。筆記個人性として,"人は同じカテゴリの文字は同じ様な字形で筆記する","人の書いた文字はカテゴリが異なっても字形には相関が存在する"ことを,定量的に検証している。 第6章「筆記個人性の手書き数字認識への応用」では,筆記特性の認識への応用として,認識結果からの誤読文字の検出方法を提案し,効果を実験的に確認している。誤読文字の検出方法は,"誤読文字の字形と正読文字のそれとを比較した時に誤読文字にはなんらかの不自然さが存在する筈である"という考え方に基いており,字形の組み合わせの不自然さを同じカテゴリに認識された文字同士の比較から求める方法と,異なるカテゴリに認識された文字同士の比較から求める方法とを提案し,筆記個人性を認識に応用することにより,パタン情報のみを用いる場合には検出が困難と思われる誤読文字も検出することができ,認識結果を改善できること,不自然さを単独に用いるよりも,不自然さと距離値を併用する方が誤読検出能力は高いこと,同じカテゴリに認識された文字同士の比較から不自然さを求める方が誤読検出能力は高いことを,実験により明らかにしている。 第7章は,「結論」であって本研究の成果を纒めている。 以上これを要するに,本論文は手書き数字認識の高精度化を目的として,距離関数の新しい学習方法として判別分析を用いるLDA法を提案し,パタン整合法へ適用して有効性を検証し,更に,筆記の個人性を抽出して認識結果の改善を図る手法を提案して有効性を検証する等,手書き文字認識技術の進展に寄与するところが多大であり,電気・電子工学に貢献するところが少なくない。 よって本論文は博士(工学)の学位請求論文として合格と認められる。 |