学位論文要旨



No 217383
著者(漢字) 田中,章夫
著者(英字)
著者(カナ) タナカ,アキオ
標題(和) 有機化合物の合成設計における情報化学的研究
標題(洋) Chemoinformatics Study on Synthesis Design of Organic Compounds
報告番号 217383
報告番号 乙17383
学位授与日 2010.07.08
学位種別 論文博士
学位種類 博士(工学)
学位記番号 第17383号
研究科
専攻
論文審査委員 主査: 東京大学 教授 船津,公人
 東京大学 教授 山口,由岐夫
 東京大学 教授 堂免,一成
 東京大学 教授 野崎,京子
 東京大学 准教授 牛山,浩
内容要旨 要旨を表示する

序文

コンピュータプログラムによる合成ルート探索に関する最初の論文は1969年のCoreyとWipkeが開発したOCSS(後のLHASA)の論文であった。LHASAはインターラクティブ型であったのに対して、1972年にBersohnによって最初のバッチ型のシステムが発表された(後のSYNSUP)。日本では1986年に船津教授がAIPHOSを発表し、住友化学はSYNSUPおよびAIPHOSの開発に参画してきた。化学企業では高活性、高機能な化合物のスクリーニング研究や、より安価な合成ルートの探索、早期の工業化製法の確立に、合成反応設計システムの活用が期待されている。実用的な合成反応設計システムの開発を目指して次の3つの課題に取り組んできた。課題1)組合せの爆発による提案ルート数の肥大化を回避するためのルート探索の絞込み、課題2)進行しない、あるいは副反応により目的物を選択的に得られないルート提案の回避、課題3)新規データの追加。課題1については、逆合成上有用な結合を見出すための新規のパラメータおよび評価式を提案し、その結合に特化したルート提案手法を開発した。課題2については、副反応が起こる可能性を予測するために、官能基と反応条件の反応性をデータベース化し、反応部位以外の官能基の反応性についての評価手法を開発した。課題3に対しては、前述の反応性データベースを市販の反応データベースから自動的に抽出することが出来るモジュールを開発した。そして合成反応設計システムの活用事例として、治験薬化合物のルート探索からの新規ルートの検証実験と、本システムを用いて新規中間体探索についても検討した。本論文では上記の検討結果について報告する。

逆合成上重要な結合(Key-bond)の認識

合成ルートを探索する場合、合成標的分子が小さく2,3ステップで誘導することが出来る場合、全ての結合について合成の可能性を検討しても、実行時間や提案件数はあまり問題にならない。しかし、分子が大きくなると組合せの爆発によりルート件数が膨大になり、ユーザーが評価することが困難な実用的でない結果が得られるようになる。このような膨大な提案を避けるために、合成すべき重要な構造や結合に絞り込んだ合成ルート探索手法を開発した。定量的な逆合成上有用な結合の評価として、グラフ理論を利用した分子構造の複雑度を表すパラメータMolecular complexityを用いる手法がこれまでに知られているが、本論文ではConvergent synthesisを指向した、Molecular complexityより簡易的で同等の評価ができる新規なパラメータBond centralityを開発した。Silphineneの8種類の既知合成ルート(全49ステップ)を用いて、Molecular complexity(Cr)の各ステップでの変化量△CTとproduct側の反応中心の結合のなかでのBond centralityの最大値HBCRC(Highest Bond Centrality in Reaction Centers)との相関で検証した結果、逆合成上重要な結合を見つける指標として利用できることが確認できた(Fig.1)。Bond centralityに加えて、結合の反応性や合成の容易性を表す指標として結合乖離エネルギー(BDE)を取り込んだ評価式を統計的に構築することを検討した。既存の反応データベースに登録された反応式中の反応部位の結合のBond centralityとBDEを説明変数に用いて、Logistic Regression Analysis(LoRA)を実施した。得られた統計式P5を評価式に用いた。その各係数の符号からBond centralityはより大きくBDEはより小さい方が合成上より重要な結合になることを意味し、言い換えれば、分子の中心に近くて切れやすい結合の方が逆合成上重要な結合となることを統計的に示すことが出来た。評価式P5で高い値を示す結合を逆合成上重要な結合(Key-bondと呼ぶ)として認識する。

新規合成ルート探索手法(Selective Search)の開発

合成上重要と認識されたKey-bondに絞り込んだ合成ルート探索を行う際に、Key-bondを構築する反応が存在しない場合や、適用を予定している反応が他の官能基に影響を及ぼし目的とする反応が達成できない場合がある。後者は保護基導入や不活性な官能基に変換することで期待する結合の構築が可能になる。一方、前者の反応が存在しない場合に、次点の合成上有望な結合に着目することが選択肢に挙げられるが、反応が存在しないKey-bondでも周辺を若干構造変化させることで合成でき効率的なルート提案ができる可能性がある。Key-bondが構築できる反応をConstructing bond reaction、Key-bondが構築できるように周辺の構造変換や保護基導入反応をFacilitating reactionと呼んで分類し適用機会を区別した。

Facilitating reactionによるKey-bondの周辺部位の構造変換には電子吸引基の導入や結合を不飽和化する反応が該当する(Fig.2)。Transform1から6は合成上重要な結合およびそのα、β位の結合を不飽和化するか電子吸引基の導入による構造変化(facilitating reactionを適用)とその後の逆合成でKey-bondの切断例(constructing reactionを適用)を示している。以上の操作をプログラムに組み込み、天然物の既知合成ルートと比較した結果、同等のルートが短時間で提案されることを確認した。複雑な化合物について短時間で合成ルートを探索する手法としてSelective Searchが有効であることが分かった。

反応性データベースの構築

有機化合物の構造が大きく複雑になればなるほど官能基が分子内に多く存在するようになる。多官能基を有する有機化合物を効率的に合成するためには、反応条件を慎重に選び、副反応を回避するルートを採用する必要がある。特に、工業的な観点から不純物を含まないプロセスの開発は重要である。そのようなプロセスを開発するために合成反応設計システムを利用することは意義があるが、官能基の反応性を正確に評価できる機能が求められる。SYNSUPでは官能基と反応条件の反応性データ(interfering/inert data)と官能基間の反応性をデータ化した競争反応データ(relative rate data)を市販の反応データベースから抽出できるモジュールを開発した。ISIS/Baseのデータベース名CCR(Current Chemical Reaction)の1995,1996,1997年に登録されている15265件のはんのう反応式から反応性データ1278件、競争反応データ62件を抽出することができた。データはSYNSUPに登録されて、副反応を抑えるルート提案に生かされている。

合成反応設計システムの活用例1(新規ルート探索)

合成設計システムSYNSUPを用いて治験薬azapirane化合物1のルート提案を実施し、既存ルートより少ない工程で合成できる新規ルートが提案されたため、検証実験を実施した。中間体のジケトンの還元が立体障害により収率を下げて、結果として既知ルートより優れたルートではなかったが(Scheme 1)、SYNSUPの実用性を確認することが出来た。

合成反応設計システム活用例2(有望中間体の探索)

複数のターゲットに対して共通に利用できる多様性に富んだ出発原料や中間体を見出すことができれば、総合的に生産コストの削減が期待できる。また、中間体から誘導される医薬品候補および物性探索のための化合物群のスクリーニング研究に役立つ。しかし、一見関連の無い複数のターゲットから共通な原料あるいは中間体(以降、共通中間体と呼ぶ)を探し出すことは容易ではない。この複数のターゲットから共通中間体を探し出す作業について、合成反応設計システムSYNSUPの利用を検討した。複数のターゲットからSYNSUPを用いて共通中間体を抽出する流れはFig.3の通り。

ターゲット全てをSYNSUPでルート提案し、各ターゲットの中間体を提案ルートから抽出、ターゲット間で共通な中間体を認識して共通中間体を抽出する。開発中あるいは市販の抗うつ剤24化合物から共通中間体の抽出を行った。既知合成ルートからの共通中間体は3化合物であり、合成できるターゲット数は2に限定されていた。一方、SYNSUPによる抽出結果は、2つのターゲットに利用できる共通中間体が166化台物見つかった。さらに、3化合物以上のターゲットに利用できる共通中間体の候補化合物が複数存在することが分かった(Fig.4)。この抽出結果から、新たな中間体のビジネスへと結びつけることができる可能性を示すことができた。

現在、住友化学グループでは合成反応設計システムを研究者自ら合成研究の際に利用できるシステムとして公開されており、広く利用されるようになっている。

Figure1.Silphineneの既知合成ルートの全ステップでの△CT対HBCRCのプロット

Figure2.Selective searchのためのTransform

Scheme1.化合物1の新規提案ルート検証結果

Figure3.SYNSUPを用いた共通有望中間体の抽出フロー。T1,T2,Tnはターゲット化合物,S1,S2,Snは出発原料、P1,P2,Pnは中間体

Figure4.共通中間体数とターゲット数

審査要旨 要旨を表示する

本論文は「Chemoinformatics Study on Synthesis Design of Organic Compounds (有機化合物の合成設計における情報化学的研究)」と題し、多段階にわたる有機化合物の合成ルート探索に対して、効率的な骨格変換に絞り込み、副反応の少ない合成ルートを探索するための新しいアルゴリズムを提案することを目的としたもので、全6章から構成されている。

第一章では、イントロダクションとして合成反応設計システムを開発する目的および既存のシステムを紹介し、多段階のルート探索における問題点を指摘し、本論文の目的、課題および方針について述べている。

第二章では、合成ルートの効率的な探索を目的として、逆合成上重要な結合の認識について、新たなパラメータおよび統計解析を駆使した評価手法を提案している。化合物の逆合成上重要な結合の認識のために、Convergent synthesisを指向した、新たなパラメータBond centralityを提案している。市販の反応データベースに登録されている反応式の生成物側の結合に注目した場合、反応部位の結合とそれ以外の結合の間の差異を統計的な手法で調べるために、結合の特徴を現すパラメータ、Bond centralityと結合解離エネルギーの推算値を用いて、非線形重回帰手法のLogistic regression analysisによって、統計的な差異が存在することを明らかにしている。求めた統計式について、天然物化合物の既知の合成ルートを用いて検証することで、逆合成上重要な結合の認識のための評価式として利用できることを明らかにしている。

第三章では、評価式から認識される逆合成上重要な結合の構築に特化した合成ルート探索を行うことで、多段階にわたる合成ルート探索において、組合せの爆発による提案ルートの発散が起きることなく、効率的な骨格変換に絞り込んだルート探索ができる手法を提案している。評価式から認識されてきた逆合成上重要な結合に対して合成出来る反応が存在しない場合には、保護基導入や6種類の結合周辺の官能基を変換させることにより、逆合成上重要な結合の構築を実現させる手法について論じている。

第四章では、官能基と反応条件の反応性を評価するデータベースの提案と、市販の反応データベースから自動的に抽出する方法について論じている。合成したい化合物の前駆体候補を提案する際に、想定している反応部位の骨格変換を正確に行うのみならず、反応部位以外の官能基が反応条件によって影響を与えないことも確認しなければ、確度の高い合成ルートを提案することができないため、新規の2種類のデータベース(反応阻害データと競争反応データ)を用いる反応部位以外の官能基の反応性を評価する手法を提案している。そして新しいデータベースの構築については、市販の反応データベースから自動的に誘導する手法を提案している。

第五章では、本研究によって機能を強化した合成反応設計システムの具体的な提案能力と活用事例について論じている。治験薬の合成法についてシステムで合成ルート探索を実施したところ、既知の合成法に加えて、出発原料が安価でステップ数の短い新規な合成法が提案され、検証実験により新規で実用的なルート探索が行えることを示している。システムの合成ルート探索以外の活用法として、複数の化合物についてシステムからの提案ルートに含まれる中間体を精査することによって、汎用的に用いることができる新規な有望中間体探索を自動的に実現する手法を提案している。

第六章では、本論文を総括し、そこから導き出される課題ならびに今後の展望について論じている。

以上要するに、本論文は、逆合成上重要な結合の認識のために、反応データベースに登録されている生成物側の結合の特徴を統計解析から抽出し、導いた評価式から逆合成上重要であると認識される結合の構築に特化した新しいルート探索手法を開発し、さらに反応部位以外の官能基の反応条件に対する影響を評価するために反応性データベースを構築する新しいアプローチによって、複雑な有機化合物でも短時間で確度の高い実用的な合成ルートが提案できることを示したものであり、化学システム工学及び情報化学分野の発展に寄与するところ大である。

よって本論文は博士(工学)の学位請求論文として合格と認められる。

UTokyo Repositoryリンク