学位論文要旨



No 110753
著者(漢字) 于,冬
著者(英字)
著者(カナ) ウ,トウ
標題(和) 漢字フォントの自動生成システムに関する研究
標題(洋)
報告番号 110753
報告番号 甲10753
学位授与日 1994.05.19
学位種別 課程博士
学位種類 博士(工学)
学位記番号 博工第3239号
研究科 工学系研究科
専攻 情報工学専攻
論文審査委員 主査: 東京大学 助教授 廣瀬,通孝
 東京大学 教授 井上,博允
 東京大学 教授 田中,英彦
 東京大学 教授 武市,正人
 東京大学 教授 月尾,嘉男
内容要旨

 近年、計算機による文書処理が一般的となり、デスクトップパブリッシングも普及しつつある。しかしながら、漢字文化圏においてはこの傾向が遅れ気味なのが現状である。漢字は文字数が非常に多く、また形状も複雑なために、英数字に比べて新しいフォントの作成が非常に困難であるためである。実際、新たな漢字フォントを作成するには、熟練したデザイナと大勢のオペレータが関わり、莫大な時間とコストが必要とされている。本研究では、これらの繁雑な作業を大幅に軽減できる、実用的な漢字フォントの自動生成システムの開発を目標とした。漢字フォントの自動生成に関してはいくつかの研究例があるが、いずれも実用に耐えるとは言い難いため、市販のフォントに比べて見劣りしないレベルのフォントを作成できるシステムが開発できれば、その工学的意義は大きいと思われる。本研究では実用性を重視し、(1)多くの文字(少なくともJIS第一水準)を作成できる。(2)同じ骨格線データから多書体の作成を可能にする。(3)作成されたフォントが実用に耐える美しさであること、の3点を課題として研究を行なった。

 漢字フォント(主としてアウトラインフォント)の自動生成に関する研究は、(1)エレメント合成法、(2)部品合成法の二つに大別される。(1)は、骨格線に肉づけをして基本エレメントを作成し、そのエレメントを漢字枠内に貼り付けて漢字を作成する方法である。(2)は、偏や旁などの部首を組み合わせて漢字を生成する方法である。部品合成法はエレメント合成法に比べて、入力データを大幅に削減でき、製作コストが低いという特徴を有する反面、バランスのとれた漢字の作成が困難であるという大きな問題点を抱えている。本研究では、バランスのとれた美しい文字を生成することを重視するため、(1)のエレメント合成法を採用することとした。

 エレメント合成法による従来の研究には、以下のような問題点があるため、本研究においてはこれらを解決することが必要である。

(a)エレメントの肉付けアルゴリズムが書体依存である

 従来の研究例では、書体の形状に応じてエレメント肉付けアルゴリズムを用意しているが、この方法では多様なフォントを作成することが困難である。アルゴリズムは書体に依存せずに、再利用できることが望ましい。

(b)骨格線データの多書体への再利用が困難である

 漢字は数が非常に多いため、骨格線データの定義はたいへん時間のかかる作業である。このため、実際の利用を考えた場合、多様な種類のフォントを作成するためには、既存の骨格線データを再利用できることが必要である。しかしながら、従来の研究の多くにおいては、この問題は解決されていない。

(c)書体変更の際にプログラムの書換えが必要である

 上記(a)と同様、多種多様なフォントを作成するためには、プログラムは書体に非依存であることが望まれる。従来の研究例では、これらの問題が軽視される傾向にある。

(d)GUIによる優れたユーザインタフェースの作成が困難である

 漢字フォントの輪郭線の形状は複雑であるため、輪郭線のデータ構造をコンパクトにすることが困難である。このため、グラフィックエディタの操作方法が繁雑になることを避けられず、結果としてGUIが軽視されてしまっている場合が多い。

 以上の問題点を解決するため、本研究では独自のエレメントデータ表現方法と漢字フォント生成アルゴリズムを開発した。本研究でのアプローチの特徴を以下にまとめる。

(1)骨格線データとエレメントデータの定義の分離

 従来の肉付けアルゴリズムに当たる、漢字ストローク形状生成部において、骨格線データとエレメントデータの定義を分離して行なっている。これによって、両者が相互に制約し合うことを回避することができる。したがって、新たな書体を作成する場合にはエレメントデータのみを作成すればよく、骨格線データの大部分は既存のものを再利用することができる。

(2)独自のエレメントデータ表現法

 エレメントのデータ表現には、独自の骨格線上相対座標系による表現法を採用した。また、エレメント輪郭線の形状は、2次Bスプライン曲線を用いて表現するものとした。2次Bスプラインは優れた接続性を有し、扱いが平易である。したがって、優れたユーザインタフェースの作成が可能になると考えられる。

(3)骨格線近似による漢字ストローク形状の生成

 上述の(1)と(2)により、エレメント骨格線を漢字骨格線に近似することによって、漢字ストロークの形状が生成される。したがって、書体に依存しない肉付けアルゴリズムを実現することができる。

(4)エレメント選択によるストローク接続部の処理

 ストローク同士の接続部では、形状を適当な形に変化させる必要がある。従来の研究では、形状パラメータまたはプログラムを修正することでストローク接続部の処理を行なってきた。本研究では、予め変更処理を施したエレメントを用意し、ストローク接続部処理をエレメント選択作業に変換し、この問題に対処している。このことにより、書体変更に伴うプログラムの書換えが不要となった。

(5)特徴パターンの利用

 上記(1)によって大部分の骨格線データを再利用することができる。本研究ではさらに、各書体の特徴を表す特徴パターンの定義、検索および変形処理を行なう機能を用意し、特徴パターンによるエレメント選択を可能にすると同時に、骨格線データの変更作業を最小限に抑えるよう工夫している。

 本研究では、上記のアプローチに基づいて実際にプロトタイプのシステムを作成した。図1にシステムの構成図を示す。まず、ユーザがエレメントデータと漢字骨格線を別々に定義する。すると、システムがエレメントを骨格線に合うように変形し、漢字の各ストロークを生成する。生成されたストロークは漢字枠内に貼り付けられ、パラメトリックフォントが作られる。

図1:システム構成

 このようにして開発したシステムを用いて、実際に漢字フォント生成実験を行なった。作成した漢字はJIS第一水準と第二水準第一区の一部、計3,000字である。作成した書体は、明朝体、ゴシック体、見出し明朝体、見出しゴシック体の4書体のほか、新書体であるファンテール体と明石明朝体の2書体を含む計6書体である。

 さらに本研究で提案したシステムの能力と有効性を明らかにするために、開発したシステムを用いてフォント作成作業実験を行なった。また、作成されたフォントの品質評価のためのアンケート調査も実施した。これらの結果から、(1)未経験の作業者であっても現在の手作業によるフォント作成に比べ大幅に作業時間が軽減されること、(2)生成されたフォントの品質は、日常的な使用に耐える優れたものであることが確認された。本稿および博士論文の原稿も、本研究で作成したフォントを用いて印刷したものである。

 以上が本研究の概要である。以下に、結論をまとめる。

 ・本研究では、独自の漢字パラメトリックフォント生成アルゴリズムを考案し、それを実現するためのプロトタイプシステムを開発した。

 ・作成したシステムを用いて、6書体について、各々JIS第一水準2,965文字を含む3,000字、計18,000字を生成した。

 ・作成したシステムの使用による作業効率を評価した。また、作成したフォントは十分実用に耐え得る品質のものであることを確認した。これらによって、本システムの有用性を確かめることができた。

審査要旨

 この論文は「漢字フォントの自動生成システムに関する研究」と題し、10章より構成されている。この中では、漢字フォント自動生成アルゴリズムに関する議論と提案、システムの試作、漢字フォントの生成実験および結果に関する評価がなされている。

 第1章「序論」では、本研究の背景とその目的、意義に関する筆者の認識が示されている。

 第2章「デジタルタイポグラフィの現状」では、デジタルタイポグラフィ技術の現在の状況が紹介されている。とくに、ビットマップフォントとアウトラインフォントとの特徴の比較が行なわれ、アウトラインフォントが今後主流になるであろうことが示されている。また、現在の漢字アウトラインフォント作成プロセスが紹介され、漢字フォントを作成する上での問題点が整理されて示されている。

 第3章「漢字フォント自動生成システムに関する従来の研究」では、漢字フォント自動生成に関する従来の研究が整理されている。従来の研究における漢字フォント生成アルゴリズムはエレメント合成法と部品合成法の2種類に大別できることが示され、各方法の問題点がそれぞれ指摘されている。それをふまえて、実用的な漢字フォント生成システムを実現するには、従来の研究における問題点を克服できる漢字フォント生成アルゴリズムが必要であることが示されている。

 第4章「本研究で提案する漢字フォント生成システムの概要」では、第3章で挙げた問題を解決するために、本研究で提案する漢字フォント生成システムの概要が述べられている。まず、実用的な漢字フォント生成システムの条件が挙げられ、これらの条件を満たすように設計された漢字フォント生成アルゴリズムの概要が紹介されている。さらに、実際に作成したシステムの具体的構成が示されている。

 第5章「漢字パラメトリックフォント生成アルゴリズム」では、前章で提案した漢字フォント生成アルゴリズムに関する詳説が行なわれている。本研究では、漢字骨格線データとエレメントデータの定義を分離して行っている。エレメントのデータ表現には、独自の骨格線上相対座標系による表現法を採用し、輪郭線形状は2次Bスプライン曲線を用いて表現している。漢字ストローク形状の生成はエレメント骨格線を漢字骨格線に近似することによって行われる。ストローク接続部における変形処理問題に関しては、予め変形処理を施したエレメントデータを用意し、ストローク接続処理をエレメント選択作業に変換することで対処している。上記のことによって、本研究では、(1)書体に依存しない、(2)骨格線の再利用が容易である、(3)書体変更においてプログラムの書き換えが不要である、(4)優れたGUIユーザインタフェースの作成が容易であるといったような特徴を有する漢字フォント生成アルゴリズムが実現されている。

 第6章「漢字フォントの生成実験」では、本研究で試作した漢字フォント生成システムを用いて、漢字フォント生成実験が行なわれている。実験で作成される漢字は第一水準と第二水準の一部で、合計3,000字である。作成する書体は、明朝体、ゴシック体、見出し明朝体、見出しゴシック体の4書体のほか、新書体であるファンテール体と明石明朝体の2書体も含まれている。

 第7章「かなフォント作成およびTeXによる文書出力」では、作成したフォントのTeX清書システムにおける利用について述べられている。日本語の文書においては漢字以外にかな文字も使用されるため、かなフォントの作成についても説明が行なわれている。

 第8章「本研究における漢字フォント生成に関する評価」では、本研究のシステムを用いて作成したフォントについて、作成所要時間とフォント品質の両面から客観的な評価が行なわれ、本研究で提案した漢字フォント生成システムの有効性が確認されている。

 第9章「システムインプリメンテーション」では、本研究で試作したシステムのインプリメンテーションについて述べられている。

 第10章「結論」では、以上の議論を総括され、まとめとして整理されている。

 以上要約すると、この論文では、実用的な漢字フォント生成システムを目指して、独自の漢字パラメトリックフォント生成アルゴリズムが考案され、それを実現するプロトタイプシステムが開発されている。作成したシステムを用いて、6書体について各々JIS第一水準2,965文字を含む3,000字、計18,000字を生成する実験が行なわれている。漢字フォント生成所要時間およびフォント品質に関する客観的な評価を行なった結果、本システムは従来より短時間と少ない労力で十分実用に耐える品質のフォントを作成できることが確認されている。このように、本研究で述べられている方法論は、漢字フォントの自動生成技術に貢献するところがきわめて大きい。よって、本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク