学位論文要旨



No 213630
著者(漢字) 福嶋,敬宜
著者(英字)
著者(カナ) フクシマ,ノリヨシ
標題(和) 画像解析・人工知能による病理診断の精度向上のための研究 : 乳管内増殖性病変の良悪性判定
標題(洋)
報告番号 213630
報告番号 乙13630
学位授与日 1997.12.24
学位種別 論文博士
学位種類 博士(医学)
学位記番号 第13630号
研究科
専攻
論文審査委員 主査: 東京大学 教授 森,茂郎
 東京大学 教授 脊山,洋右
 東京大学 助教授 村上,俊一
 東京大学 助教授 北村,聖
 東京大学 講師 石田,剛
内容要旨

 病理組織診断は病気(特に腫瘍性病変)による変化を形態的に分類して治療や研究の基礎となる重要な情報を提供する。病理診断はその患者の確定診断となることが多く,画像診断や臨床診断の適確さの指標ともなる。しかし,この病理診断は形態学に基づくものであり,その判定は診断者の知識や主観に大きく影響される。このため診断結果(腫瘍の場合,良性か悪性か,組織型,異型度など)が施設や病理医で食い違うことも少なくない。このような病理診断のばらつきを最小限として診断精度を向上させるためには診断基準の標準化が急務であり,そのために客観的指標の導入も有用と考えられる。その試みの一つとして本研究では乳管内増殖性病変の特徴を画像解析によって数値化し,そのデータを人工知能(ニューラル・ネットワーク(NN))によって解析して診断を行なうことが可能かの検討を行なった。乳管内増殖性病変を対象とした理由は,病理組織診断において,良・悪性の鑑別が難しい病変の一つであり,特に乳管上皮過形成や乳頭腫と非浸潤性乳頭癌の鑑別は日常の診療においてもしばしば問題となる病変であるからである。

【材料と方法】

 乳管内癌,異型乳管上皮過形成,乳管内乳頭腫,乳腺症などの乳管内増殖性病変67例のホルマリン固定・バラフィン包埋組織を検討症例とした。病変抽出の際,電気メスなどによるアーチファクトが強いもの,小葉癌,壊死を伴う癌(comedo癌),組織学的異型度の高い癌症例は除外した。病理組織学的診断用にはヘマトキシリン・エオジン(HE)染色(3m切片),画像解析用にはFeulgen染色(5m切片)を連続切片で行なった。

 病理医による病理組織学的判定は3名のいずれも10年以上の経験を有する病理医によって行なった。病変の判定は,同じ標本(病変部にマーキング)を回覧して行ない,患者の年齢,肉眼所見,周囲乳腺組織の標本などは伏せて,組織形態所見のみで診断するようにした。それぞれの病理医の評価は3段階(良性,境界,悪性)とし,3人の結果から病変をPML(pathologically malignant lesion;「悪性」でほぼ一致した病変),PUL(pathologically undetermined lesion;診断の不一致例),PBL(pathologically benign lesion;「良性」でほぼ一致した病変)の3グループに分けた。

 一方,コンピュータによる画像解析とその評価は,画像(細胞核)の切り出しから解析までは画像解析システムのCAS200(Cell Analysis System)を,データの学習,判定(データの分類)実験にはNN型人工知能を用いた。細胞核の画像上の切り出しは,病変部濃淡画像から一定しきい値で半二値化を行ない半自動的に行った。細胞核が重なり合ったものは手動で切り離すか,重なりの強い場合などはその画像は破棄した。解析した細胞核数はそれぞれの病変からおよそ200個であった。切り出した画像の解析には,CAS200内蔵のCell Measurement Programを用いた。解析には,核の濃度値合計,大きさ,異型度の他,22種類のマルコフテクスチャー特徴量を用いた。マルコフテクスチャー特徴は,核内の濃度値のばらつきや均一性を数値化する特徴量である。使用したNNソフトウェア(Neural Works,Professional II/plus,Neural Warc,pittsburgh,PA)は,3層フィードフォワード型NNで,学習にはバックプロバゲーションアルゴリズム(誤差逆伝搬方法)を用いたものである。まずPMLとPBLからそれぞれ一症例を学習セットとして選出し,この学習セットの悪性の細胞核のデータに標識(10),良性の細胞核のデータに標識(01)を与えてNNに悪性および良性細胞の特徴をそれぞれ学習させた。特徴量は良悪性の判別に有効と考えられた8個(Size,Shape,Sum optical density,Sum average,Sum variance,Difference entropy,Information measure B,Coefficient of variation)を用いた。

 細胞核の分類実験では使用特徴量を変えて3種のNNを構築した。8個の特徴量全て(形態学的特徴量+テクスチャー特徴量)を使用して構築したネットワーク(A),形態学的特徴量のみを使用したネットワーク(B),テクスチャー特徴量のみを使用したネットワーク(C)の3つである。これらを用いて65病変から採取した細胞核データの分類実験を行った。

【結果】

 3人の病理医による評価結果から65病変は,それぞれPML24例,PUL16例,PBL25例に分類された(図1)。カイ二乘検定で得られた最適しきい値でのされぞれの良性悪性(PULを除く)の一致率は,ネットワーク(A)で69.4%,ネットワーク(B)で67.3%,ネットワーク(C)で65.3%と,ネットワーク(A)が最も高かった。さらにカイ二乗値/有意確率Pは(A)7.16/0.0075,(B)4.58/0.0323,(C)4.54/0.0330と,ネットワーク(A)が最も高いカイ二乗値と最も低い有意確率を示した。以上のような結果から,ネットワーク(A)がネットワーク(B)(C)より判別力があると考えた。判別分析では良性と悪性病変を分ける最適しきい値は42.3%以上48.9%未満で得られた。PML-NNMの一致率は37.5%PBL-NNBの一致率は96.0%,PULを除いた病変判定の一致率は67.3%で,ネットワーク(A)を越える一致率は得られなかった。

【考案】

 コンピュータによる病理診断システムの開発は,病理組織所見の特徴(核や組織構築)を数値化していくことから始まる。今回の我々の実験では,細胞核の特徴に焦点を絞って解析を行なった。腫瘍の良性・悪性の診断において核の大きさ,形,クロマチンの濃さ・粗さなどは非常に重要な鑑別点となる。今回,病理医の判定とNNの判定結果の一致率はPUL症例を除いて約70%と比較的高いものであり,用いた特徴量で,これらの核所見がある程度数値データに反映されたと考えられた。画像の特徴量を用いた細胞の判別には統計的手法も応用可能であるが,データにオーバーラップがあり,個々の症例の応用には問題がある。NNでは複数のデータを同様にプロセスしてデータの重み付けを行ない判別をするので,より生物の思考に近く,パターン認識には有効かと思われる。

 偽陰性例について病理組織学的再検討を行った結果,癌症例では核所見の多様性が大きく,これが原因の一つになっていると考えられた。つまり,悪性症例の中でも,学習症例と同様の比較的異型性の低い細胞から成る癌は正しく「悪性」と認識出来るが,異型性が強いものはかえって誤認されやすかったと考えられる。

 使用するバラメータによる判別実験では,形態学的特徴量とテキスチャー特徴量を複合した場合がそれら単独のみの時よりも良い成績であった。今回の実験では,単一施設からの標本が用いられ,薄切,染色とも一貫して同一人物が行っており,標本間のバラツキが小さいと考えられた。テクスチャー特徴量の有用性は,子宮頚癌細胞,乳癌細胞の核異型度分類などの検討からこれまでにも報告されており,今回の実験で形態学的特徴量とテクスチャー特徴量を複合した場合がそれら単独の時よりも良い成績であったのは理にかなった結果であったと考えられる。

 今回の検討はコンピュータによる病理診断支援システム開発の第一歩であるが,実験を通して種々の問題点が明らかに成ったと同時に,将来の実用化の可能性も示唆する結果であったと考える。今後,病変内の細胞集団のデータの平均やバラツキなど,さらには組織構築を特徴量化していけば,実用化レベルまで病変判定の精度を上げることが充分可能と考えられた。またNNによる判別において,どの様な因子が重要かというデータを病理医に還元することも,病理診断自体の標準化に寄与すると思われる。

図1.ネットワーク(A)による細胞分類率のヒストグラムPML、Pathologically malignant lesion:PUL、Pathologically undetermined lesion:PBL、Pathologically benign lesion.NNM、Neural network-malignant
審査要旨

 本研究は,診断者の知識や主観に大きく影響されがちな病理診断の診断精度を向上させるための診断基準の標準化のためのものであり,乳管内増殖性病変の特徴を画像解析によって数値化し,そのデータを人工知能で解析して診断を行なうことが可能かの検討を行い下記の結果を得ている。

 1.細胞核の分類実験では使用特徴量を変えて構築した3種のニューラル・ネットワーク,(A)8個の特徴量全て(形態学的特徴量+テクスチャー特徴量)を使用,(B)形態学的特徴量のみを使用,(C)テクスチャー特徴量のみを使用,を用いて乳管内増殖性病変65病変から採取した細胞核データの分類実験を行っている。3人の病理医による評価結果から65病変は,それぞれPML(病理学的悪性病変)24例,PUL(病理学的判定の困難な病変)16例,PBL(病理学的良性病変)25例に分類され,最適しきい値でのされぞれの良性悪性(PULを除く)の一致率は,ネットワーク(A)で69.4%,ネットワーク(B)で67.3%,ネットワーク(C)で65.3%と,ネットワーク(A)が最も高かった事が示された。この結果により,良悪性判定のための良好なニューラルネットワーク構築には,他種類の情報を組み合わせて解析することの重要性が明らかになると共に,細胞核の画像解析におけるテクスチャー特徴量の有効性が確認された。テクスチャー特徴量は画像濃度のばらつきを数値化するパラメーターであり,核内のクロマチン分布の違いを有効に客観化し得ることを示唆している。

 2.マハラノビスの判別分析によって同様の解析を行ったところ,PULを除いた病変の判定の一致率は67.3%であった。このことから,人工知能(ニューラルネットワーク)では複数のデータを同様にプロセスしてデータの重み付けを行ない判別をするので,より生物の思考に近く,画像解析から細胞の良悪性を判別する様なパターン認識には有効性が高いとの考察が示された。

 3.今後,病変内の細胞集団のデータの平均やバラツキなど,さらには組織構築を特徴量化していけば,実用化レベルまで病変判定の精度を上げることが充分可能と考えられた。

 以上,本論文はコンピュータによる病理診断支援システム開発の第一歩として,実験を通して種々の問題点を明らかにすると同時に,将来の実用化の可能性も示唆する結果が示されたと考えられる。また画像解析による判別においてどの様な因子が重要かというデータを病理医に還元することも,病理診断の標準化に寄与するものであり,学位の授与に値するものと考えられる。

UTokyo Repositoryリンク