学位論文要旨



No 217774
著者(漢字) 前田,恵理子
著者(英字)
著者(カナ) マエダ,エリコ
標題(和) 読影パフォーマンスの測定手法に関する研究
標題(洋)
報告番号 217774
報告番号 乙17774
学位授与日 2013.01.23
学位種別 論文博士
学位種類 博士(医学)
学位記番号 第17774号
研究科
専攻
論文審査委員 主査: 東京大学 教授 宮川,清
 東京大学 准教授 桐生,茂
 東京大学 准教授 中島,敏明
 東京大学 講師 鈴木,崇彦
 東京大学 講師 長野,宏一朗
内容要旨 要旨を表示する

【全体の目的】認知心理学領域で用いられる「視覚探索課題」の手法を応用し、臨床現場では統制の難しい難易度、読影時間、読影環境などの条件を管理したうえで画像診断の「正しさ」「速さ」「疲労」といったパフォーマンスを定量する実験系を構築し、放射線科医のパフォーマンスを定量する。種々の疲労測定法について、読影疲労測定の有用性を検証し、実験環境および臨床現場での読影疲労の実態を知る。

実験1 1枚表示に関する検討

【目的】読影条件や難易度を管理して読影精度・速度を定量する実験系を構築する。

【方法】被検者は東京大学医学部附属病院の放射線科医10名(26-41歳、男性9名、女性1名、放射線科医としての経験年数2-16年、非専門医6名、専門医4名)。刺激画像は検診で撮像されたまったく所見のない胸部単純CT 250枚を背景とし、この中から無作為に選んだ画像上に、臨床例等からくりぬいた気腫性嚢胞・すりガラス結節・充実性肺腺癌を無作為に配置して「標的あり画像」を作成した。気腫を背景画像に配置した800枚(全体の40%)、すりガラス結節を配置した160枚(8%)、充実性結節を配置した40枚(2%)に加えて背景画像1,000枚の、合計2,000枚を実験に用いた。実験では、暗室でコンピュータを用いて無作為にこれらの2,000枚の画像を提示し、被検者はボタン押しで病変の有無や種類を回答した。被検者は、標的を見つけたら、なるべく早く正確にボタン押しで回答するように教示された。刺激画像の提示時間は最大でも1,000msで、参加者が1,000ms以内に回答した場合にはその時点で刺激画像は消えた。被検者の回答と反応時間が測定され、反応時間が4,000ms以下の試行について、非専門医・専門医間で反応時間や、画像番号ごとの正答率等を検討した。

【結果】病変の頻度がわかっていることから正答率・感度・特異度・陽性的中率・陰性的中率を求めることができたほか、反応時間を計測することができた。非専門医・専門医間で正答率・感度・特異度・陽性的中率・陰性的中率には有意差を認めなかったが、反応時間は「気腫」でのみ専門医群が有意に速かった(0.72±0.10 vs 0.71±0.10 sec, p=0.0024)。

【考察】気腫は他の2標的に比べて周囲肺実質とのコントラストが弱く、見つけにくいと考えられることから、専門医はトレーニングにより、難易度の高い病変でより早く正答にたどり着くことができる可能性が示唆された。実験の信頼性を高めるためには難易度を挙げる必要があると考えられた。

実験2 スタック表示に関する検討

【目的】動画を用いることで実験1の難易度を上げた実験を行い、放射線科医の経験による視特性の差異を検討する。

【方法】被検者は東京大学医学部附属病院の放射線科医10名(29-42歳;平均34.6歳、男性8名、女性2名、放射線科医としての経験年数3-18年;平均9.5年)。検診で撮像されたまったく所見のない胸部単純CT 276枚を背景とし、これらの画像から連続する10枚の画像をまとめて1組とし、40組の連続画像を作成した。標的画像としては臨床例から空洞性結節を用意し、背景画像40組に、くりぬいた4種の空洞性結節のいずれかを置いて標的あり画像として連続画像40組を用意した。標的は10枚の連続画像のうち、2枚目から9枚目のいずれか1枚に置いた。10枚の画像のうち、1枚目は1,000ms提示され、課題レベルに応じて一定時間ずつ2-9枚目が順に提示され、10枚目が1,000ms提示された。実験では暗室でコンピュータを用いて提示し、被検者はボタン押しで病変の有無や種類を回答した。被検者は、標的を見つけたら、なるべく早く正確にボタン押しで回答するように教示された。被検者は標的出現頻度を伝えられなかった。

難易度は被検者ごとに、画像の切り替え速度(以下課題レベル)を変えることで調節した。実験1日目に、レベル決め用に作成した標的出現頻度50%の課題を、1枚当たりの提示時間500msから最速50msまで徐々に上げ、各参加者の標的刺激の見落とし率が25%前後になるような速さ(課題レベル)を探り、このレベルで本試行を行った。

実験2日目に1日目と同様の課題を行い、レベル決めの成否を確認した。2名がレベル決めの失敗が示唆され、除外された。その後の本試行では、上記のレベルで背景画像を980回、標的あり画像を20回(全体の2%)の1,000試行を1セットとして無作為に提示し、回答の正誤および、画像の提示からキーを押すまでの反応時間、正解が提示されてからキーが押されるまでの正解反応時間のデータを得た。画像番号ごとに各被検者の平均正答率、平均反応時間、平均正解反応時間を求めたのち、放射線科診断専門医資格の有無によりの2群に分け(非専門医4名、専門医4名)、各群の平均を求めて比較した。

【結果】各被検者のレベルは平均7.4±1.0であった(平均提示時間/枚は167ms)。経験年数・平均読影時間・平均読影件数・昨日睡眠時間・平均睡眠時間のいずれも、求められたレベルと有意な相関は認められなかった。非専門医群・専門医群それぞれの正答率、感度、特異度、陽性的中率、陰性的中率には有意差を認めなかった。反応時間、正解反応時間は、いずれの標的でも専門医で有意に短かった。

【考察】非専門医の病変検出能力は専門医に劣らないが、専門医の方が病変検出の処理速度が速いことが示された。背景の血管等の連続性を確認できる連続画像表示を用いることで、標的をかなり小さくすることができ、画像切り替え速度を変えることによっても難易度の調節ができた。切り替え速度以外の方法による難易度調節は今後の課題と考えられた

実験3 疲労測定に関する検討

【目的】医用画像読影の作業疲労の検出に適した方法を検討する。

【方法】実験2の本試行の前後で、産業疲労研究会提供の「自覚症しらべ」、動体視力測定、フリッカー融合頻度(critical flicker fusion frequency; CFF)の3つの方法により作業疲労を測定し、比較検討した。実験2で除外された2名を除く8名のデータを解析に用いた。それぞれの測定方法につき、実験前後での平均値および、非専門医群と専門医群の平均値の差異を検討した。また、それぞれの測定値と年齢・放射線科医歴・昨日睡眠時間・平均睡眠時間との相関も検討した。

【結果】実験前後での比較では、自覚症しらべには合計、各項目とも有意差を認めず、読影疲労測定に有用でないと考えられた。動体視力は実験前に比べ、実験後に有意に向上し(0.35±0.16→0.40±0.16, p=0.037)、これも有用でないと考えられた。CFFは、実験前に比べ、実験後に有意に低下し(37.7±3.5→35.0±2.9, p=0.028)、有用と考えられた。専門医資格の有無による比較では、非専門医は、専門医に比べて実験前の自覚症調べによる疲労度(合計、ねむけ感、不快感)が有意に高かった。

【考察】読影疲労の測定には、CFFは有用、「自覚症しらべ」と動体視力は有用ではなかった。CFFは客観的指標であり、読影疲労を反映する主観的指標の検索が必要と考えられた。非専門医は、専門医に比べて実験前から自覚的に有意に疲労していたが、有意差はないものの専門医に比べて非専門医は読影件数が多く、読影時間が長く、睡眠時間が短い傾向が見られ、非専門医の実験前の疲労はこの差異に起因すると推測された。

実験4 読影疲労に関する検討

【目的】臨床現場におけるCFFおよびvisual analogue scale (VAS) による読影疲労測定の有用性の検証。

【方法】7名の放射線科診断専門医(平均年齢35歳、30-47歳;平均経験年数10.1年、6-21年)が、検診読影の前後で5週間にわたり読影者の前日・平均睡眠時間やVASを用いた自覚的疲労度に関する問診票を記入し、CFFを測定した。問診票のVASは0-1の数値に変換された(0が生涯で最悪に疲れた状態、1が生涯で最も元気な状態を表す)。

【結果】読影後、自覚的疲労度は有意に増悪し(読影前0.52±0.15 vs. 読影後0.42±0.15, p<0.0001)、CFFも有意に低下した(40.9±2.4 vs. 39.9±2.0, p=0.0002)。自覚的疲労度とCFFの間は読影前後とも相関はなく(相関係数:読影前-0.02、読影後0.0091)、自覚的疲労度とCFF各々の読影前後の差同士の間にも有意な相関を認めなかった(0.14, p=0.36)。前日の睡眠時間は自覚的疲労度と相関を認めないものの、CFFと有意な相関を認めた(読影前0.42, p=0.0047;読影後 0.52, p=0.0003)。

【考察】CFFは読影後に有意に低下し、読影疲労の指標として有用と考えられた。VASも読影後に有意に低下し、読影に伴う自覚的疲労度の指標として有用と考えられた。CFFは前日睡眠時間が不足の場合に、自覚的疲労を伴わずに低下することから、睡眠不足は無自覚のうちに視機能の低下を招くことが示唆された。

【全体の考察】

認知心理実験の環境を応用することで、読影環境、画像提示時間、難易度を統制した実験系を作成し、臨床環境での検討では求めづらい感度・特異度・陽性的中率・陰性的中率・反応速度を求めることができた。本実験程度の病変検出能力は非専門医でも専門医と差がない一方反応時間は専門医で有意に速く、トレーニングにより量をこなす能力が向上することが示唆された。非専門医のトレーニングは「量をこなすことができるようになるためのトレーニング」とバランスをとりつつ、様々な所見の適切な記述、より多彩で正確な鑑別診断など、知識の獲得にも重点が置かれるべきと考えられた。

睡眠不足は無自覚のうちに視機能の低下を招くことから、放射線科医は読影前に十分睡眠をとる必要があり、当直明けなど睡眠不足時に自身の視機能を過信してはいけないと考えられる。

審査要旨 要旨を表示する

本研究には三つの目的が存在する。一つは臨床現場では統制の難しい読影条件を管理したうえで画像診断の「正しさ」「速さ」「疲労」といったパフォーマンスを定量するために、認知心理学領域で用いられる「視覚探索課題」の手法を応用した実験系を構築することである。二つ目はその実験系により実際の放射線科医のパフォーマンスを定量することであった。三つ目は種々の疲労測定法について、読影疲労測定の有用性を検証し、実験環境および臨床現場での読影疲労の実態を知ることである。一連の実験により、下記の結果を得ている。

1.所見のない検診胸部単純CTを背景画像とし、標的として臨床例等から病変をくりぬいて背景画像を無作為に配置することで、標的のある画像とない画像を作成した。暗室でコンピュータを用いて無作為にこれらの画像を提示し、被検者にテンキーのボタン押しで病変の有無や種類を回答させることで、医用画像を用いた1,000試行単位の多数の試行からなる視覚探索実験を比較的容易に作成することができた。表示画像を1枚表示、連続画像の動画などと変えることにより、実験条件を様々にコントロールすることも可能であった。

2.病変の頻度がわかっていることから臨床現場では求めにくい正答率・感度・特異度・陽性的中率・陰性的中率を求めることができたほか、これまで報告がない、放射線科医の反応時間を計測することができた。

3.1枚表示で「気腫」「すりガラス結節」「充実性結節」の3種類の標的を用いて放射線科診断専門医資格の有無により非専門医と専門医の2群に分け探索特性を検討すると、正答率・感度・特異度・陽性的中率・陰性的中率には有意差を認めなかったが、反応時間は「気腫」でのみ専門医群が有意に速かった(0.72±0.10 vs 0.71±0.10 sec, p=0.0024)。

4.動画表示では、標的出現頻度50%の課題において標的刺激の見落とし率が25%前後になるような切り替え速度を被検者ごとに検索した。切り替え速度と経験年数・平均読影時間・平均読影件数・昨日睡眠時間・平均睡眠時間のいずれも有意な相関は認められなかった。

5.動画表示では非専門医群・専門医群それぞれの正答率、感度、特異度、陽性的中率、陰性的中率には有意差を認めなかった。反応時間(画像の提示から回答キーを押すまでの時間)、正解反応時間(標的あり画像の提示からキーを押すまでの時間)は、いずれの標的でも専門医で有意に短かった。

6.動画表示による実験の前後で、産業疲労研究会提供の「自覚症しらべ」、動体視力測定、フリッカー融合頻度(critical flicker fusion frequency; CFF)の3つの方法により作業疲労を測定し、比較検討したところ、実験前後での比較では、自覚症しらべには合計、各項目とも有意差を認めず、読影疲労測定に有用でないと考えられた。動体視力は実験前に比べ、実験後に逆に有意に向上し、これも有用でないと考えられた。CFFは、実験前に比べ、実験後に有意に低下し、有用と考えられた。

7.上記で有用とされたCFFとvisual analogue scale (VAS) による読影疲労測定の、臨床現場における有用性の検証するために、検診読影の前後で読影者の前日・平均睡眠時間やVASを用いた自覚的疲労度に関する問診票を記入し、CFFを測定した。問診票のVASは0-1の数値に変換された(0が生涯で最悪に疲れた状態、1が生涯で最も元気な状態を表す)。読影後、自覚的疲労度は有意に増悪し(読影前0.52±0.15 vs. 読影後0.42±0.15, p<0.0001)、CFFも有意に低下した(40.9±2.4 vs. 39.9±2.0, p=0.0002)。自覚的疲労度とCFFの間は読影前後とも相関はなく(相関係数:読影前-0.02、読影後0.0091)、自覚的疲労度とCFF各々の読影前後の差同士の間にも有意な相関を認めなかった(0.14, p=0.36)。前日の睡眠時間は自覚的疲労度と相関を認めないものの、CFFと有意な相関を認めた(読影前0.42, p=0.0047;読影後 0.52, p=0.0003)。

以上、認知心理実験の環境を応用することで、これまでに報告のない読影環境、画像提示時間、難易度を統制した実験系を作成した。これにより臨床環境での検討では求めづらい感度・特異度・陽性的中率・陰性的中率を求めることができ、これまで測定されたことなかった放射線科医の反応速度を測定することができた。本実験程度で行った程度の病変探索であれば、感度・特異度・陽性的中率・陰性的中率には非専門医・専門医間に差がない一方、反応時間は専門医で有意に速いことが示された。読影疲労に適した疲労測定方法はこれまで検討されていなかったが、本研究により自覚的疲労度の指標として自覚症しらべは適さずVASが適すること、また客観的指標として動体視力測定は適さずCFFが適することが示された。CFFおよびVASとも臨床現場でも有用であることが示され、CFFには睡眠とも関連があることが示された。本研究は、これまで未知であった読影パフォーマンスの測定に重要な貢献をなすと考えられ、学位の授与に値するものと考えられる。

UTokyo Repositoryリンク