学位論文要旨



No 117749
著者(漢字) 玉田,俊平太
著者(英字)
著者(カナ) タマダ,シュンペイタ
標題(和) 「特許と論文等とのリンケージに関する研究」
標題(洋)
報告番号 117749
報告番号 甲17749
学位授与日 2003.03.12
学位種別 課程博士
学位種類 博士(学術)
学位記番号 博工第5382号
研究科 工学系研究科
専攻 先端学際工学専攻
論文審査委員 主査: 東京大学 教授 児玉,文雄
 東京大学 教授 後藤,晃
 東京大学 教授 馬場,靖憲
 東京大学 教授 堀,浩一
 東京大学 教授 橋本,毅彦
内容要旨 要旨を表示する

 特許が引用している論文等の数(サイエンスリンケージ)は、産業の生産性向上の要因である「技術」と、知的活動の体系的集積である「科学」との間をつなぐ指標として、いくつかの留意点はあるものの、有効な指標であると考えられている。

 しかしながら、日本特許を対象としたサイエンスリンケージの研究は、調査した限りでは見つけることが出来なかった。日本特許が十分に調査研究されていないのは、日本特許が重要でないからではない。むしろ、日本という米国や欧州に比肩する国内総生産を持つ国における技術革新のメカニズムを研究するためには、日本国において出願された特許について研究することが必要不可欠だと考えられる。

 そこで、本研究においては、日本国特許庁の公報データを対象とした研究を行った。

 最初に、日本特許においても米国特許や欧州特許などのように他の特許や論文を引用が存在するか否かを明らかとするため、バイオ技術分野特許とその補集合特許のそれぞれに対するサンプリング調査を行った。

 その結果、まず、参照文献の記載が法律で義務づけられていなかった日本特許にも他の特許や論文等に対する引用が存在することが明らかとなった。同時に、日本特許においては、フロントページの「参照文献」(引用文献が記載される任意項目)を調査するだけでは、引用文献の分析として十分ではないことが明らかとなった。さらに、可能な範囲でサイエンスリンケージの日米比較を試みたところ、主としてヒトゲノム技術からなる「バイオ技術分野」の特許のサイエンスリンケージが、他の技術分野と比較して明らかに多く、この傾向は日米で共通であることも明らかとなった。

 この結果を踏まえ、1995年から1999年の5年間に特許性有りと審査され、公開された特許約65万件を対象とし、第二次科学技術基本計画において重点分野とされた、バイオテクノロジー、ナノテクノロジー、情報技術(IT)、環境関連技術の4つの技術分野に属する特許をデータベースより抽出した。さらに、それら技術分野毎の特許部分集合からランダムサンプリングにより300件ずつのサンプルを取り、無作為抽出300サンプルのコントロールとも比較しつつ、日本特許の他の特許及び論文等に対する引用の傾向について、特許全文を対象に、目視により分析を行った。さらに、技術分野毎にサンプリングされた特許を、さらに特許権者の国籍で分類し、技術分野別・国籍別に1特許あたり平均サイエンスリンケージを算出し、その傾向を比較した。

 その結果、国籍別に分析しても、サイエンスリンケージの水準こそ異なるものの、技術分野間のサイエンスリンケージの違いは残り、バイオが突出し、ナノテクがそれに続き、IT及び環境技術は論文等の引用が少なかった。すなわち、特許の属する技術分野による1特許あたり平均論文等引用数の違いは、特許権者がどこの国の研究機関において研究しているかによる影響よりも、技術の持つ本質的な特性によるものではないか、と推測される。

 次に、1特許あたりの請求項に違いがあるために、このサイエンスリンケージの技術分野による違いが生じているのではないか、という問いに答えるため、サンプリングした4技術分野、1200件の特許について、特許1件ごとの請求項を数え、請求項とサイエンスリンケージの関係について調査し、分析を行った。

 その結果、米国特許ではサイエンスリンケージも多いが請求項も多いため、1請求項あたりのサイエンスリンケージは、かえって国毎の差が縮小し、技術分野による違いが際立つ結果となった。ここでも、最もサイエンスリンケージの多い技術分野はバイオテクノロジーであり、ナノテクノロジーがそれに続いた。日本国籍の特許においては、ITがそれに続き、環境技術分野のサイエンスリンケージが最も低くなった。したがって、請求項を単位としても、バイオ技術のサイエンスリンケージが突出し、ナノテクノロジーがこれに続き、ITと環境技術は少ないという傾向に変化はなかった。

 次に、特許によって引用されている論文等を可能な限り収集した。そして、収集した論文等の著者の、住所から推定した国籍、著者の所属機関の属性を調査した。さらに、引用されている論文等の謝辞から、当該論文等を助成している機関の属性及び国籍を調査し、それらの因果関係につき分析を行った。

 その結果、バイオ技術分野においては、日本特許150サンプルに引用されている735本の論文等の研究機関の国籍は、アメリカが53%、次いで日本の25%、欧州等の23%の順であった。アメリカの83特許に引用された1140本においても、アメリカの論文等が日本同様一番多く、次いで欧州等の論文25%、日本のものは3%であった。欧州等から出願された43件の特許は、891本の論文等を引用しており、これもアメリカのものが一番多く55%を占め、次は自らのエリアから40%、最後が日本のもので、5%であった。

 バイオ技術分野特許で特徴的なのは、出願人の国籍がどこであれ、米国の論文等の引用比率が一番高い、という事実である。人の移動や言語の壁等、知識の伝搬にも一定のトランザクションコストがかかるとすると、距離的に近接した、あるいは、言語が共通な地域の論文等をより多く引用する傾向があると類推されるし、実際にそういった先行研究も存在する(Narin et al. ,1997)。にもかかわらず、バイオ技術分野においては、米国の論文等の引用がどの国の特許においても最も多いという結果は、ナリンの言うstrong national componentを凌駕するほど、アメリカがバイオ研究においては活発に知識を発信しており、世界に対して影響を与えている、ということが言えるのではないだろうか。

 こうしたバイオ分野において特に強く見られるアメリカ論文等の引用は、いかなる理由によるものであろうか。この問いに対する答えを模索するため、各分野の論文の謝辞を調べ、"this research is supported by"というように、直接的に助成を受けた記述を抜き出した。

 その結果、バイオ技術分野特許が引用している論文等約4300件のうち、76%が助成を受けた旨の記述があった。これは、ナノテク分野の42%、IT分野の31%、環境分野の43%と比べても、高い数値であると言えよう。助成機関のほとんどがアメリカに所在することも、バイオ分野の特徴である。そして、バイオ分野被引用論文の著者の所属機関の属性をみると、大学が約59%と多く、次いで国公立研究機関が約18%で、両者を合計すると約76%となる。企業に所属する著者は13%である。

 これらの結果をまとめると、サイエンスリンケージが際立って多いバイオテクノロジー分野では、(1)引用されている論文等の著者が所属する組織にアメリカの研究機関が多いこと、(2)その機関は大学等公的機関が占める割合が高いこと、さらに、(3)論文の謝辞にアメリカの助成機関が記載されている比率が高いこと、の3点である。この結果は、バイオテクノロジー分野においては米国が優位であり、産学連携や大学発ベンチャーが活発に生まれていること、NIHをはじめとする助成金額においてもアメリカが多いと言われていることとも整合的である。

 さて、これまでの一連の研究によって、科学技術基本計画において重点分野とされた主要4分野特許サンプルデータの、人手による分析結果は、我が国で初めての試みとして一定の知見を我々にもたらしてくれた。しかし、一方で、公開・公表・再公表238万件、公告・登録全件88万件からすれば、ごく一部にすぎない。しかも、技術分野毎のフィルタリングによって、意図せざるバイアスがかかっている可能性も否定できない。そこで、人手で抽出した結果を「教師」として、サイエンスリンケージ自動抽出プログラムの構築の可能性につき調査を行った。

 その結果、サンプル特許データからの引用を人手により抽出したものと比較してもかなり高い精度(約98%)を持つプログラムを作成することに成功した。これにより、引用特許及び論文等の自動抽出が可能であることが示されたとともに、細かく、かつ排他的な特許技術分類レベルで、網羅的にサイエンスリンケージを調査することが可能となった。

 この新しく開発した手法を用いて、1995年から1999年に公報に掲載された約88万件の特許を対象に、約600分類の技術分野毎にサイエンスリンケージを調査した結果、日本において最もサイエンスリンケージが多い分野は「C12N微生物又は酵素」、次いで「C07K有機化学、ペプチド」であった。これは、ミッチェルらによる欧州特許におけるサイエンスリンケージの傾向とも一致する。(Michel et al. ,2001)

 また、発行年を基準とし、4技術分野特許におけるサイエンスリンケージを自動計測した結果、サイエンスリンケージは年とともに増加傾向にあることが明らかとなった。これは、ナリンらの結果とも整合的である。

 本研究の結果、日本特許におけるサイエンスリンケージの差違は、主として技術分野の違いによるものであること、引用された論文は大学や国立研究機関によるものが多いこと、多くの研究が公的サポートを受けたものであること、が明らかとなった。

 さらに、特許の引用している他の特許や論文等がかなり高い精度で自動抽出できる可能性があること、それによって得られた網羅的かつ排他的技術分野別サイエンスリンケージ計測によって、サイエンスリンケージが多い技術分野が特定できたこと、発行年別時系列分析によれば、サイエンスリンケージは増加傾向にあることが明らかとなった。

審査要旨 要旨を表示する

 本研究は、日本国特許庁の公報データを対象とし、特許が引用している論文等の数(サイエンスリンケージ)を計測したものである。

 最初に、基礎となる日本特許に関するデータベースを構築している。次いで、日本特許においても米国特許や欧州特許などのように他の特許や論文を引用が存在するか否かを明らかとするため、バイオ技術分野特許に対するサンプリング調査を行っている。その結果、まず、参照文献の記載が法律で義務づけられていなかった日本特許にも他の特許や論文等に対する引用が存在することを明らかにした。同時に、日本特許においては、フロントページの「参照文献」(引用文献が記載される任意項目)を調査するだけでは、引用文献の分析として十分ではないことも明らかにした。

 こうした結果を踏まえ、1995年から1999年の5年間に特許性有りと審査され、公開された特許約65万件を対象とし、科学技術基本計画において重点分野とされた、バイオテクノロジー、ナノテクノロジー、情報技術(IT)、環境関連技術の4つの技術分野に属する特許をデータベースより抽出し、ランダムサンプリングにより300件ずつのサンプルを取り、無作為抽出300サンプルとも比較しつつ、日本特許の他の特許及び論文等に対する引用の傾向について、特許全文を対象に、目視により分析を行っている。

 その結果、サンプルに占める論文等を引用している特許の割合についても、特許一件当たりの平均論文等引用件数においても、多い順に、バイオ技術分野、ナノテク分野、IT分野、最後に環境技術分野という明らかな傾向が見られた。このような技術分野の違いによるサイエンスリンケージの違いについて、その原因を分析するため、特許権者の住所から推定した国籍の分布を調査した。調査結果は、バイオ特許権者の50%が外国に住所がある機関からの出願であり、その比率はナノテクノロジーでは28%、ITでは19%、環境関連技術では12%という結果となった。

 この調査結果は、1特許あたり平均サイエンスリンケージが多い技術分野の順番と同一である。従って、サイエンスリンケージが多いのは、外国人の出願比率が多く、それが技術分野毎の平均サイエンスリンケージに影響を与えているだけではないか、という仮説が成り立つ。そこで、技術分野毎にサンプリングされた特許を、特許権者の国籍で分類し、技術分野別・国籍別に1特許あたり平均サイエンスリンケージを算出し、その傾向を比較した。結果は前述した仮説に反し、国籍別に分析しても、サイエンスリンケージの水準こそ異なるものの、技術分野間のサイエンスリンケージの違いは残り、バイオが突出し、ナノテクがそれに続き、IT及び環境技術は論文等の引用が少ないことが明らかにされた。

 次に、サンプリングした4技術分野、1200件の特許について、特許1件ごとの請求項を数え、請求項とサイエンスリンケージの関係について調査している。その結果、米国特許ではサイエンスリンケージも多いが請求項も多いため、1請求項あたりのサイエンスリンケージは、かえって国毎の差が縮小し、技術分野による違いが際立つ結果となった。ここでも、最もサイエンスリンケージの多い技術分野はバイオテクノロジーであり、ナノテクノロジーがそれに続いた。日本国籍の特許においては、ITがそれに続き、環境技術分野のサイエンスリンケージが最も低くなった。

 技術分野によってサイエンスリンケージが何故異なっているのかという問いに対する答えを模索するため、特許によって引用されている論文等を可能な限り収集し、収集した論文等の著者の国籍、所属機関の属性を調査している。さらに、引用されている論文等の謝辞から、当該論文等を助成している機関の属性及び国籍を調査し、それらの因果関係につき分析を行っている。バイオ分野において、引用されている著者の所属機間の国籍が明らかとなった約2800本の論文等の分布を見ると。アメリカの著者が60%と過半数を占め、日本のものは9%にとどまっている、3位以下の順位は、イギリス8%、ドイツ4%である。同様に、ナノテクノロジーにおいては約400件中アメリカの論文が58%、次いで日本が22%、以下イギリス6%、フランス4%の順となり、日本の論文等が特許に引用された比率が2倍以上に上昇しているのが注目される。

 助成については、バイオ技術分野特許が引用している論文等約4900件のうち、76%が助成を受けた旨の記述があった。これは、ナノテク分野の42%、IT分野の31%、環境分野の49%と比べても、高い数値であった。助成機関のほとんどが米国に所在することも、バイオ分野の特徴である。そして、バイオ分野被引用論文の著者の所属機関の属性をみると、大学が約59%と群を抜いて多く、次いで国公立研究機関が約18%で、両者を合計すると約76%となる。企業に所属する著者は19%である。

 主要4分野特許サンプルデータの、人手による分析結果から、いくつかの新たな知見が得られたが、公開・公表・再公表238万件、公告・登録全件88万件からすれば、ごく一部にすぎない。しかも、技術分野毎のフィルタリングによって、意図せざるバイアスがかかっている可能性も否定できない。そこで、人手で抽出した結果を「教師」として、サイエンスリンケージ自動抽出プログラムの構築の可能性につき調査を行っている。その結果、サンプル特許データからの引用を人手により抽出したものと比較してもかなり高い精度(約98%)を持つプログラムを作成することに成功している。これにより、引用特許及び論文等の自動抽出が可能であることが示されたとともに、細かく、かつ排他的な特許技術分類レベルで、網羅的にサイエンスリンケージを調査することが可能となった。

 この新しく開発した手法を用いて、1995年から1999年に公報に掲載された約88万件の特許を対象に、約600分類の技術分野毎にサイエンスリンケージを調査した結果、日本において最もサイエンスリンケージが多い分野は「C12N微生物又は酵素」、次いで「C07K有機化学、ペプチド」であった。また、発行年を基準とし、4技術分野特許におけるサイエンスリンケージを自動計測した結果、サイエンスリンケージは年とともに増加傾向にあることを明らかにしている。

 本研究は、日本特許の表紙だけでなく、全文を対象として行ったものであり、オリジナリティが高い。また、特許数だけでなく、請求項数によってもコントロールを行うなど、研究の手法も適切である。さらに、人間が目視によって抽出した特許の引用情報を基に、コンピューターによる特許全文テキストデータからの特許全数につき、約98%の精度で引用論文等の抽出を達成し、今後の日本特許引用分析に多くの可能性を示した。

 よって本論文は博士(学術)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク