審査要旨 | | 環境,農業,生物を対象としたデータ解析においては,その情報を単純な式やパラメトリックなモデルに帰着させることが困難な場合が多い。そこで本研究では,環境が農業生産に及ぼす影響を解析しモデル化することを目的とし,そのための理論的手法としてとくに近年大きな進歩がみられるノンパラメトリック回帰に注目し,ノンパラメトリック回帰に関する独自な手法とアルゴリズムの開発をおこなうとともに,その農学データへの適用を試みた。ノンパラメトリック回帰においては,できるだけ弱い仮定だけを設け,データのもつ情報を素直に引きだそうとするものであり,現象を単純な式や少ない数の変数で表現することよりも予測能力が重視される。 1.ノンパラメトリック回帰を応用した回帰手法の開発:ノンパラメトリック回帰は,直線回帰や重回帰のような従来の線形回帰を基本に据えて発展したものであるが,その過程で,エイシアシング誤差,二項フィルター,ハット・マトリクス,LOWESS,スムージィング・スプライン,クロス・バリデーション,ジェネラライズド・クロス・バリデーションなどの有用な概念や手法を生み出した。これらとノンパラメトリック回帰との関連について種々の考察をおこなった。それを基礎とした理論的研究により,ノンパラメトリック回帰に関するいくつかの新しい手法とアルゴリズムの開発をおこなった。まず「隣り合う残差の相関がゼロになるような推定値のうち最も滑らかな推定値を採用する」という方針に基づく平滑化手法を提案した。この方法では,データが推定値に近いという方針は陽には表現されてなく,また誤差の分布も仮定していないため,幅広いデータに対応できる特徴があることが認められた。また,データに含まれるさまざまな外れ値に対応するため,「平行な2本の直線の間にかなりの数のデータがある,という条件の下で,2本の直線の切片の差を小さくする」という方針の回帰手法を開発した。この方法は非線形最適化を必要とするので計算量が多いのが欠点であるが,外れ値の有無や数が明かでない大量のデータの解析にとくに有効である。つぎに直交する基底を使ってアディティブ・モデルを構成する二つのアルゴリズムを提案した。一つは,あらかじめ直交する基底を用意しておいて最小二乗法によってアディティブ・モデルを求める方法であり,もう一つは,シュミットの直交化法を用いてデータから直交する基底を導き,最小二乗法を使わないでアディティブ・モデルを構成する方法である。またジェネラライズド・スムージィング・スプラインを用いて,分布で表現された独立変数を持つデータに対応する平滑化を行うアルゴリズムを導いた。この方法によれば,分布を平均値や中間値のような代表値に置き換えてしまうことによる情報の損失を避けることができる。総合的考察から,スプライン関数を用いた平滑化や補間の方法を一般化し,「実際のデータと,仮想データをカーネルを用いて重み付き平均を行って平滑化した推定値とが近いかまたは同じ値をとる」という方針をとると,補間,平滑化,アディティブ・モデルの導出を統一した形式で実現するアルゴリズムが得られることを示した。この方法を利用するには,データの性質にふさわしいカーネルの組合せを求めなければならない。そこで,最近注目されているターボ・アルゴリズムと呼ばれる方法を利用してカーネルの組合せを求める手法を開発した。 2.ノンパラメトリック回帰を応用した作物データの解析:トウモロコシの絹糸抽出日の予測手法として,日々の気象条件の関数としてその日の生育率を定義し,その累積値がある一定値を超えたときに作物がある生育ステージを迎える,という仮説を用いる方法がある。そこで,「分布を独立変数とするノンパラメトリック回帰」を応用して,生育率を与える関数を求める方法を開発し,畜産試験場及び農業試験場で得られたデータの解析を行った結果,本方法の実用性の高さが明らかになった。つぎに「一般的な基底を用いたノンパラメトリック回帰」を用いて,県の水稲収量を予測するため,気象要素を独立変数とするノンパラメトリックな関数を求めた。その結果,重回帰を用いた場合に比べ,とくに収量が平年より大きくはずれた場合に,ノンパラメトリック回帰の予測能力が優れていることが分かった。さらにアディティブ・モデルを求める方法を応用し,気象条件の長期的な変動が水稲の収量に及ぼす影響を解析し,その方法の有用性を確認した。 以上要するに,本研究によって農学への適用を目的としたノンパラメトリック回帰の新しい生物測定学的手法とアルゴリズムが開発され,その農学データへの有効な適用とともに,学術上重要な知見と考察が提供された。よって審査員一同は,本論文が博士(農学)の学位論文として価値あるものと認めた。 |