学位論文要旨



No 114862
著者(漢字) 余地,寛
著者(英字)
著者(カナ) ヨチ,ヒロシ
標題(和) 医療情報の共有・再利用のための標準化とワーキング用語導入に関する方法論的考察
標題(洋)
報告番号 114862
報告番号 甲14862
学位授与日 2000.03.08
学位種別 課程博士
学位種類 博士(医学)
学位記番号 博医第1527号
研究科 医学系研究科
専攻 社会医学専攻
論文審査委員 主査: 東京大学 教授 上野,照剛
 東京大学 教授 大橋,靖雄
 東京大学 教授 吉田,謙一
 学術情報センター 教授 小山,照夫
 東京大学 助教授 横山,和仁
内容要旨 背景

 医学に関する情報が豊富になり、情報技術が大きく進展してきたが、医療情報の共有と再利用へのニーズがますます高まってきている。このような動向は、次のような研究が活発になってきていることに現れている。

 ・標準傷病名集・標準医学用語集・医学シソーラスの編纂

 ・医学文献のWeb上での情報検索、エビデンスに基づく医学

 ・病院情報システム構築を基盤とする電子カルテの実現

 ・SGML/XMLなどの規格による、電子医療文書の仕様の取り決め

 ・情報通信による医療情報交換の標準化

 ・大規模医療データベースからのデータマイニング

 ・医療関連データウェアハウスの構築

 これらの研究は、いずれも、医学に関する「言葉」に関わっており、医学用語を整備することが、これらの研究を促進し、統合的な視点を得るために必要なことである。また、医療情報は医学用語で表され、データが蓄積されていくが、医療情報の共有と再利用を進めていくためには、医学用語の統一を行い、表記上のゆれを抑えるなどの、医学用語の標準化が不可欠である。

 医学用語の標準化に基づいて、データが蓄積されていくが、これまで、医学用語として整備されてきたものの多くは、解剖学用語、生化学用語などの基礎医学用語や、傷病名、手術用語、検査名、処置名、略語、慣用語などの実務的な用語であった。ところが、医療情報の共有と再利用にとって必要な、医療行為の過程で用いられる語彙の整備は、ほとんどなされていないのが現状である。整備が必要な語彙としては、例えば、次のようなものがあげられる。

 ・患者の病態を把握するアセスメント用語

 ・診断の根拠、検査結果にたいする所見を表現する用語

 ・治療計画・目標を具体的に設定するための用語

 ・病態生理の遷移、病因を記述する用語

 これらの用語に関する個々の語彙は、もちろん、既に存在し、医療文書や論文において使用されてきた。しかし、医療行為の過程に即して、充分に開発・整備されてきたとは言い難く、何よりも標準医学用語集に収載されていないものが多い。これらの用語は、症例や医学文献を検索したり、臨床研究を設計したりするためには、整備されていなければならないものである。これらのワーキング用語の整備は新たな次元での標準化となりうる。これらの用語が用いられることにより、これまでよりも、医療文書や論文に含まれる情報が豊富になることが期待される。また、これらの用語は、医療人による、医療行為の過程における意思決定や解釈を反映したものでもあり、この過程全体をデータとして蓄積することにより、同様の過程への医療情報の再利用が有効になされるものと考えられる。

目的

 (1)医療情報の共有:医療文書を、標準化されたものに変換する手法を考案する。また、標準医学用語を用いるように誘導するシステムを提供する。

 (2)医療情報の再利用:医学的知識の命題にたいして、類推適用・拡張解釈を適用することによって、新たな命題を生成することを例題とする。

 (3)医学ワーキング用語整備の必要性と妥当性の検証:医学ワーキング用語を整備する必要性について評価モデル上での検証を行い、整備された分の用語セットの、評価モデル内での妥当性を検討する。

 (4)症例プロセスツールの開発:個々の症例や病因の解明について、知識ベース上のルールによる方法は採らず、全体論的に一系列ごとに蓄積して利用する方法を提案し、医療上のイベントの継時的成立に沿った用語群の提供について考察を与える。

 (5)医学ワーキング用語サーバの構築:ワーキング用語サーバのプロトタイプを開発し、電子カルテに組み込むことを意図した形で、各項目にたいし、その値を表現する用語群を提供する。

方法

 (1)医療情報の共有:標準医学用語がすでに確定していると仮定する。元となる文書をテキストファイルとして与え、標準医学用語に変換する辞書をCSV形式で構築し、スクリプト言語のjgawk(GNUによるAWKの日本語対応版)によるプログラムを作成・適用して文書の全体的な変換を自動的または対話的に実現する。さらに、直接入力された医学用語にたいし標準用語を提示するプログラムを実現する。

 (2)医療情報の再利用:特定的な語彙について、「語彙:範疇」という形式の、その語彙が関係する範疇を付した辞書を用意し、医学的知識を表現する事実命題の「語彙」にたいして、それを適用し、その「範疇」を介して、同じ範疇をもつ「他の語彙」を組み入れた、新たな命題を出力するプログラムをjgawkによって実現する。

 (3)医学ワーキング用語整備の必要性と妥当性:評価モデルとして、内科の診療ガイドラインの文章を用いる。既存の標準医学用語集として日本医学会医学用語辞典を使用し、医学ワーキング用語を与えるものとして既構築分の医学ワーキング用語セットを使用する。作業は手作業による。評価モデルの文章における本質的な語彙の多くが医学ワーキング用語セットの方にのみ含まれることを示すことで必要性の検証を行う。また、同じ評価モデルを用い、既構築分の医学ワーキング用語セットが、文章の本質的な語彙をどの程度含んでいるかを評価することで内部妥当性を検討する。

 (4)症例プロセスツールの開発:jgawkのCSV形式を活用し、症候名から傷病名に至る個々のプロセスを各1行に収めたレコードを集積し、大規模症例データベース構築のプロトタイプとし、定型的な医療サービスや診療ガイドラインにたいするバリアンスの位置づけを考察する手立てとする。

 (5)構築中の医学ワーキング用語サーバについて、特に、フィジカル・アセスメント用語と画像診断のサイン用語を詳細に提供するような形で、バイロットシステムを立ち上げる。システムは、PerlによるCGIで実現する。

結果・考察

 (1)の変換は、プログラムの論理性に従って、意図された結果となる。

 (2)の類推機能は、限定された範囲では、意図された結果となる。規模を大きくした場合、わずかな類推のために莫大な作業量が必要になることが容易に予想され、今後の研究が必要である。

 (3)の全体的な評価では、診療ガイドラインには、医学用語辞典に含まれていない語彙が多数存在することが分かった。特に、疾患の分類・鑑別の用語が整備されていないことが判明した。しかし、個々の診療ガイドラインについて見ると、語彙の多くが医学用語辞典に含まれる場合も存在し、辞典においうて専門分野ごとに取り組み方の相違がある。既構築分の医学ワーキング用語セットは、最初から、診療ガイドラインの語彙を含むように構築されたので、用いられた内科診断ガイドライン群については、ほとんどの語彙をカバーしている。

 (4)のプロセスツールは、病態生理に関する語彙の整備が現在のところ不十分であり、データウェアハウスツールのレベルにはない。大量の蓄積によって、定型的なケアプラン・コースが導かれるであろう。

 (5)については、量的な整備・拡充が必要である。

結論

 これまで、医学用語の統一のなさや表記のゆれのため、医療情報の共有ができないことが問題とされてきたが、本研究のようなシステムを積極的に適用することによって、共有を促進することが可能となるであろう。また、本研究で、医学ワーキング用語の整備が必要であることが見出され、この整備によって、診療ガイドラインが、代用エンドポイントではなく真のエンドポイントを用いたものに導かれうる、などの大きな効果が得られるものと期待される。

審査要旨

 本研究は、医療情報の共有と再利用へのニーズに応えるため、医療文書における医学用語を標準的なものに変換するツールを提示し、さらに、医療文書に有意な情報を取り込むべく、医学ワーキング用語を整備・開発する必要性を示し、用語サーバのプロトタイプを構築したものであり、下記の結果を得ている。

 1.医学用語が統一されていないことや表記のゆれのために、医療情報の共有が困難な状況であるが、本研究では、標準化と共有化とを区別した上で、標準医学用語が確定していることを仮定して、医療文書を、非標準的なものから標準的なものに変換して共有化を導く手法を与えた。元となる文書をテキストファイルとして与え、標準医学用語に変換する辞書をCSV形式で構築し、スクリプト言語のjgawkによるプログラムを作成・適用して文書の全体的な変換を自動的または対話的に実現している。さらに、直接入力された医学用語にたいし標準用語を提示するプログラムを実現した。また、医療分野に限定した、語彙の形態素解析システムを実現しており、既存のものと比較し、簡易で的確な処理を与えている。

 2.医療情報の再利用に向けて、「語彙:その範疇(タイプ)」という形式による、語彙の辞書を構築し、それを医療文書における事実命題の「語彙」に適用し、その「タイプ」を介して、同じタイプをもつ「他の語彙」を組み入れることで、新たな命題を生成することを行うプログラムを作成し、類推機構を実現した。これは、臨床疫学の計画を立てる上で有用である。

 3.これまでの医療情報の扱いでは、作成される医療文書は完備なものとされてきたが、データウェアハウス的な観点からは、さらなる情報蓄積が必要である。そのためには、医療文書に表現されていない、医療行為に関わる用語を整備して提供し、医療情報の運用を豊富にしていくことが考えられる。このような医学ワーキング用語のセットを構成する必要性について評価モデル上での検証を行い、構成された用語セットの、評価モデル内での妥当性を検討した。評価モデルとして、内科の診療ガイドラインの文章を用い、比較対照の医学用語集としては日本医学会医学用語辞典を用いた。その結果、診療ガイドラインには、医学用語辞典に含まれていない語彙が多数存在し、その中でも特に、疾患の分類・鑑別の用語が整備されていないことが判明した。一方、そのような語彙の多くが医学ワーキング用語セットの方に含まれていた。また、構成された医学ワーキング用語セットは、診療ガイドラインの語彙を含むことは当然のこととして構築されたので、用いられた診療ガイドライン群については、ほとんどの語彙をカバーしており、内部妥当性を有していた。

 4.データウェアハウス的運用に向けて、症候名から傷病名に至る個々のプロセスを、ワーキング用語をキーワードにして各1行に収めたCSV形式のレコードを集積し、症例プロセスツールのプロトタイプとし、評価モデルによって、その有用性を検討した。これは、大量の蓄積によって診療ガイドラインの構成に資するであろう。

 5.医学ワーキング用語サーバのプロトタイプでは、電子カルテに組み込むことを意図した形で、特に、検査・画像診断の所見を表現する語彙をWeb技術で提示している。これは、インターネット検索に利用しうる技術である。

 以上、本研究は、これまで実際には着手されていない、電子医療文書の共有化にたいし、実用的な方策を提示し、医療情報の共有・再利用に向けて、医学ワーキング用語の整備・開発を行うべきことを明らかにした。本研究は、医療情報の実際的な活用を促進させる効果をもたらし、医療の質の向上に貢献をなすと考えられ、学位の授与に値するものと考えられる。

UTokyo Repositoryリンク