学位論文要旨



No 217453
著者(漢字) 芳鐘,冬樹
著者(英字)
著者(カナ) ヨシカネ,フユキ
標題(和) 研究者の論文生産に関わる諸特性の相関に関する分析
標題(洋)
報告番号 217453
報告番号 乙17453
学位授与日 2011.02.23
学位種別 論文博士
学位種類 博士(教育学)
学位記番号 第17453号
研究科
専攻
論文審査委員 主査: 東京大学 教授 影浦,峡
 東京大学 教授 根本,彰
 東京大学 教授 牧野,篤
 東京大学 教授 南風原,朝和
 東京大学 教授 橋本,鉱市
 国立情報学研究所 准教授 西澤,正己
内容要旨 要旨を表示する

本研究は,研究者の活動状況に関する特性を異なる観点から観察・評価したとき,それらの間に何らかの関連性が認められるかについて,計算機科学分野を事例に,傾向・特徴を明らかにすることを目的とする。具体的には,(1) 共著ネットワークを考慮した重要度と,(2) 研究者個人の論文生産性との相関を中心に,本人と共著相手の状況の相関や,ある時点とその後の状況の相関という視点も含め,論文生産活動の状況に関する観点間の関連性についての傾向を明らかにした。これらの研究活動の状況に関する観点間の関連性を把握できれば,対象分野・領域における知識生産活動の特徴,特に論文生産に影響を与える要因についての知見を得ることができると考えられる。

これまで,同時期の特性間の相関を分析する研究は多くなされてきた。例えば,共著者間の特性の相関を調査した研究は,論文生産性に注目したもの,所属機関に注目したものなど多数存在し,研究者個人の生産性と共著ネットワーク上の重要度の相関を報告した研究もある。しかしながら,時間が経過した後の状況との相関に着目して,研究者の特性間の関連性に関する定量的な分析を行った研究は,これまでほとんどなされていない。また,共著ネットワークの分析において,直接的な結合相手の数のみに基づいた研究は,数多く存在するものの,より大域的なネットワーク構造を考慮に入れた結合相手の重要度や,間接的な結合関係に着目して,研究者の特性を分析した研究は,未だ十分になされているとは言い難い。HITSアルゴリズムを応用した指標によって,共著ネットワークの大域的な構造を反映した特性を測り,さらに間接的な関係の媒介性にも目を向け,それらも含めて,研究者の特性についてその後の状況との相関を分析している点に,本研究の特色がある。

計算機科学分野の理論領域と応用領域という2つの下位領域を分析の対象とした。計算機科学分野を含む自然科学系分野における最も包括的な書誌データベースのひとつであるSCI (Science Citation Index)論文データベースを情報源として,1991年から2005年までの当該分野・領域の論文書誌データを抽出し分析に用いた。データの基本的な数量は,雑誌数68(うち理論領域35,応用領域33),論文数68,352(うち理論領域28,485,応用領域39,867),延べ著者数175,055(うち理論領域64,666,応用領域110,389)である。また,名寄せ処理を施した後の異なり著者数は,理論領域で31,692,応用領域で59,771である。本研究では,分野内の研究者の相対的関係(生産性の高低,共著傾向の強弱など)を内包する抽象的な論文生成源を潜在的母集団として想定する。観察される現象(生産性分布,共著ネットワークなど)は,生成源のポテンシャリティ(潜在性)が,その外側の条件(論文産出サイクルや発表媒体の数量など,そしてそれらによって規定される論文発表の機会,論文数)に応じて現実化したものと捉える。すなわち,用いるデータは,現実態としては全数調査に基づくが,母集団そのものを構成するものでなく標本と位置付ける。

研究者の活動状況を見る観点として,(A) 個人の論文生産性と,(B) 研究協力ネットワークを考慮した重要度を設定した。(B)については,(B)-1.研究協力を行った相手の数だけ見る観点,(B)-2.相手の重要度も含めて考慮する観点,(B)-3.相手の所属の多様性,および,(B)-4.間接的な経験・知識の媒介性に細分化した。(A)は,完全計数法,調整計数法,第1著者計数法,最終著者計数法による論文数(CMP,ADJ,FST,LST)と単著論文数(SIN)を指標に用いた(論文数指標族と呼ぶ)。(B)-1.は,支援を受けた支援者の異なり数と延べ数(Cin,Cin'),支援した代表者の異なり数と延べ数(Cout,Cout'),共著パートナーの異なり数と延べ数(Cdeg,Cdeg')を指標に用いた(次数中心性指標族と呼ぶ)。(B)-2.は,HITSアルゴリズムを応用して算出する代表者としての協力実績・人脈の重要度(CL,CL'),支援者としての協力実績・人脈の重要度(CF,CF'),役割を区別しない協力実績・人脈の重要度(CC,CC')を指標に用いた(HITS指標族と呼ぶ)。そして,(B)-3.は共著相手機関の異なり数(Vorg)と共著相手国の異なり数(Vcnt)を,(B)-4.は媒介する研究者ペア数(CB)を指標に用いた(それぞれ,所属多様性指標族,媒介中心性指標と呼ぶ)。(B) 研究協力ネットワークを考慮した重要度のうち,Cin',Cout',Cdeg',CL,CF,CCは協力実績を重視するものであり,一方,Cin,Cout,Cdeg,CL',CF',CC',Vorg,Vcnt,CBは,重みなしグラフに基づき,実績よりも人脈の構成に注目するものである。また,(B)-1.次数中心性指標族と(B)-2.HITS指標族のうち,Cin('),CL(')は代表者としての重要度に,Cout('),CF(')は支援者としての重要度に,そして,Cdeg('),CC(')は役割を区別しない重要度に対応する。

研究者の論文生産に関わる特性間の関連性の分析では,現実に観察された論文数を重視し,現実の要因・制約のもとでの対象の特徴として,データそのものの特徴を指標で測る。標本の信頼性への配慮は,同じ論文生成源が同じ条件のもとで現実化する(同じ潜在的母集団から同じ量の標本が再抽出される)場合に生じうるランダムな誤差のみを想定した統計的有意性の確認にとどめる。ただし,特性間の関連性の分析結果をより適切に解釈できるようにするための下地として,各研究領域の研究者の生産性および共著傾向の基本的な状況については,その潜在的な特徴にも目を向け,標本をもとにした現象の再構築,論文数に応じた現象の変化の分析を行う。具体的には,各々の領域について,2,000ずつに区切った標本量ごとに,ランダムサブサンプリングを10,000回繰り返すことで指標の平均値を求めるモンテカルロシミュレーションを行い,標本量の変化に伴う指標の挙動を観察する。

1991年~1995年と1996年~2000年,および1996年~2000年と2001年~2005年を,それぞれ対にして,対象研究者の状況と共著者の状況,そして特定の時期の状況とその後の状況という視点も含めて各指標の相関を調査した。相関の強さは,影響関係を直接示すものではないが,その可能性の有無,程度についての示唆が得られるものと考える。また,因子分析などの手法を採らず,相関係数に基づく分析を行う理由は,複数の変数の背後に潜む要因ではなく,設定した観点そのものが重要と考える立場を本研究はとり,それらの観点に対応する指標同士の関連性が見たいからである。

分析結果から明らかにした点のうち主要なものを以下にまとめる。まず,全般的な状況の動的傾向に関しては,領域全体の論文の数が等しいという条件のもとでは,理論領域に属する研究者の方が,応用領域の研究者より,平均して多くの論文を生産しており,平均論文数の成長率を見ても,理論領域の方が一貫して高い値を保ち続けている。つまり,応用領域に比べて,理論領域は,領域の論文生産数が増えていく過程で,新たな周辺的な著者が加わる傾向は弱く,同じ著者が繰り返し論文を生産する傾向が強い。平均共著パートナー数の成長率の変化では,1995年以前の応用領域の減衰が遅いことが,最も顕著な点として観察された。1995年以前の応用領域は,論文の生産数を増やすのに,多くの新たなパートナーを要する傾向が相対的に強いと推測される。

同時期の特性間の相関に関しては,完全計数法による論文数CMPは,全般的に他の指標との相関がある程度は高かった。特に,調整計数法による論文数ADJとの相関が比較的高かったが,それでも両指標の相関係数は0.70を下回っており,研究パフォーマンスの評価の場面などにおいて,完全計数法で調整計数法を代替することは妥当とは必ずしも言い難い。本人のその後の特性を測る指標に対しては,完全計数法による論文数CMPおよび媒介ペア数CBが,全般的にある程度高い相関を示していた。その後の論文数CMPに対して相関が最も高いのは,同じ指標CMPだったが,その後のネットワーク関係基本指標Cdeg,Vorgに対しては,それらの指標自身でなく,媒介ペア数CBの相関が高かった。媒介ペア数CBは,パートナーを変えつつ論文の発表を繰り返す傾向に関わる指標であるが,そうした傾向が,単なるパートナー数の多寡よりも,その後のネットワーク構築に影響している可能性もあると考える。共著者のその後の特性を測る指標に対しては,相関が最も高い指標は,HITS指標族CC('),CL('),CF(')だった。HITS指標族によって測られるところの「隣接する研究者とのつながりの多さだけでなく,それら周囲の研究者が形成する関係をも含めた,より広範囲なつながりの構成」が,共著した相手のその後の状況に,ある程度強く影響している可能性が窺える。

理論領域の方が,応用領域よりも,指標間の相関が強い傾向が観察された。統計量の標本量依存性に起因して,比較する条件(各々の領域内の論文数)が変われば,相関係数は変化する。両領域の比較結果を一般化するに際して注意を要する。ただし,例えば,完全計数法による論文数CMPに関わる相関については,CMPの平均値の動的傾向から,等しい条件のもとで比べると理論領域の方が一般的に相関が強くなると推測しうる。

審査要旨 要旨を表示する

研究者の論文発表状況の記述とモデル化は計量書誌学における大きな課題の一つであり,これをめぐって,同時期の相関を分析した研究は多くなされている。しかし,時間が経過した後の状況との相関に着目した研究は,これまでほとんどなされていない。本研究は,計算機科学分野の研究者を対象に,論文生産性と共著ネットワーク上の重要度の相関を中心に,本人と共著相手の状況の相関や,ある時点とその後の状況の相関という視点も含め,論文発表状況に関する指標間の相関について傾向を明らかにすることを試みている。

第1章では,本研究の問題設定について詳述するとともに,指標間の相関を明らかにする意義として,研究評価における指標の代替可能性や教育効果の予測可能性の把握などを挙げている。第2章では,共著をめぐる問題点の整理と,社会ネットワーク分析の既往手法の整理を行い,共著ネットワークに関して,間接的な結合関係まで考慮した研究の必要性と重要性を指摘している。

第3章と第4章は,それぞれ分析対象と手法の説明である。第3章では,Science Citation Indexから抽出したデータに基づいて,計算機科学分野における論文発表状況の概略を示している。第4章では,第2章の議論に基づき,論文発表数,次数中心性などに,媒介中心性やHITS(Hypertext Induced Topic Selection)アルゴリズムを応用した指標(HITS指標族)を加えた20の指標を設定した上で,指標の標本量依存性を踏まえた2つのアプローチを提示している。すなわち,(1) 指標間の相関分析では,現実に観察された論文数を重視し,データそのものの特徴を指標で測る,ただし,(2) 相関分析の結果を適切に解釈できるようにするため,生産性および共著傾向の基本的な状況については,モンテカルロシミュレーションで論文数の変化に伴う指標の挙動を観察する,というものである。

第5章と第6章は分析結果とそのまとめである。分析で明らかにした点として以下を挙げている。(1) 同時期の相関に関しては,完全計数法による論文発表数は,他の指標との相関が全般的にある程度高かったこと,(2) その後の指標に対しては,完全計数法による論文数だけでなく媒介中心性も,全般的にある程度相関が高かったこと,そして,(3) 共著者のその後の状況を測る指標に対して相関が最も高いのはHITS指標族だったことである。HITS指標族が測る「広範囲な人脈構成」が,共著した相手のその後の状況に,ある程度強く影響する可能性を示唆している。最後に,指標の標本量依存性を考慮し,相関の比較結果をどこまで一般化できるか検討している。

著者は,共著の状況を,時間性を考慮するとともに間接的な研究者間の関係も考慮して分析することで,研究論文生産における共著動向の研究に新たな光を当て,間接的な関係が生産性に影響することを綿密な分析に基づいて明らかにした。また、既往の手法を踏まえつつ、新たな共著分析の指標を導入し、指標間の関係を検討することで、共著を通した論文生産性の分析に求められる手法の整理にも貢献している。対象分野が限られているという制限はあるものの、計量書誌学の中心的な課題の一つである生産性と共著関係の分析に視点と分析結果の両面で重要な学術的貢献をもたらしたと認められる。以上の点で、博士(教育学)を授与するにふさわしいと判断した。

UTokyo Repositoryリンク