新薬の検索におけるITの使用:領域のレビュー

製薬会社は研究に多くのお金を費やしています。 そのため、 トップR&D予算の表では、ヘルスケア部門のすべての企業が新薬を探している製薬会社です。 実際、薬を見つけることは、干し草の山で針を見つけることに似ています。 情報技術は、この検索を高速化して保存するのに役立ちます。 新薬の検索におけるITの役割は、Habréの「バイオインフォマティクス」および「バイオテクノロジー」のセクションの記事(この記事を含む)で部分的にカバーされています。 ただし、読者には生物学からのアプローチのみが提示されます。 また、化学の成果を考慮して、より完全な概要を提供します。 興味があれば-行こう!



まず、質問に答えましょう:薬が効くには何が必要ですか? 最初に薬物分子が必要です

1)生物学的システムを通過して生物学的ターゲットに到達する-たとえば、錠剤の物質は消化管(吸収)、循環系(分布)、肝臓(代謝)を通過する必要があり、さらに腎臓から出る時間がない(排除)、そして

2)生物学的標的と相互作用-この標的は通常、対応するタンパク質です。

検索は常に2番目のポイントから開始されます。身体が「通過」できる物質は必要ありませんが、機能しません。 一方には化学物質の小さな分子があり、他方には大きなタンパク質分子があるため、2つの異なる側面からアプローチできます。



ターゲット側からのアプローチターゲットベースの 「生物学的」アプローチ)は、最初に結晶構造がわかっている生物学的ターゲットを選択し、次に何も知らない多くの分子との相互作用の可能性を調べます(つまり、それらのプロパティに関する情報があります-使用されていません)。 相互作用の可能性は、いわゆるドッキングを使用して研究されます。 要するに、手順は次のとおりです。目的のタンパク質の構造を見つけ、既知の活性物質と共に結晶化します(たとえば、 rcsb.org Webサイトの.pdbファイル)、適切なプログラム(タンパク質構造を視覚化できる)で開き、そこからリガンドを削除します(この単語で)大きな分子と相互作用する物質を呼び出します)、描かれた分子構造のベースを作成または検索し(仮想ライブラリ)、各分子が空のポケットにどれだけ収まるかを確認します。 つまり、勾配降下(およびその改善)または(あまり一般的ではないが)遺伝的アルゴリズムの助けを借りて、ポケット内の最も有利な位置を探しています。 難点:1)多くのタンパク質の構造は、結晶化することができないため、取得が困難です。 2)小分子には、空間配置(立体配座)の多くのオプションがあります;さらに、タンパク質と相互作用すると、立体配座が変化する可能があります( 誘導立体配座

画像

別の方法があります- 分子設計 (このフレーズは多くの意味を持ちますが、これが最も適切な場所です)。 既製の分子をポケットに貼り付ける代わりに、既知のリガンドとの相互作用が起こった場所に、分子断片が残ります(同じように相互作用することができるもの-生物学的等価性と呼ばれるもの)。 そして、それらは、結果として生じる立体配座が安定するように、それらの間に原子を挿入することによって断片を接続しようとします。 確かに、この方法では十分な分布が見つかりません。 そのような問題のアルゴリズム的解決には明らかに問題がある。



リガンドベースの アプローチリガンドベースの 「化学」アプローチ)は、多くの化合物の活性に関する情報があることを意味します。 そして、さらにアクティブなものを見つけたいです。 「アクティビティ」という言葉の下に隠されているものは何ですか? これは、生体内 (マウス、隔離された臓器または組織、微生物、細胞培養など)または生体外生体外) (タンパク質分子)の組み合わせに対する反応の研究の定量的および定性的結果です。 さらに、タンパク質の構造がわからない場合があります;さらに、生物の標的がまったくわからない場合があり、化合物の存在に対する生物または細胞の反応しかありません。 このアプローチの意味は、活性化合物および不活性化合物の構造に関する情報を使用して、結果を(妥当な範囲内で)補間して、まだ合成されていない新しい化合物に外挿できることです。 ここでも、いくつかのオプションがあります。 ファーマコフォアモデリング定量的な構造活性相関のモデリングです

ファーマコフォア -特定の空間分布を持つ分子フラグメントのセット。その存在により分子が活性化されます。 ほとんどの分子フラグメントの代わりに、ファーマコフォアの「表記」がより頻繁に使用されます。つまり、可能性のある生物学的等価体とともにフラグメントを含む抽象化です(たとえば、「水素結合ドナー」、「水素結合アクセプター」、「疎水基」、「芳香族フラグメント」、「 π 「通信」など)。 勾配降下の原理により、「表記法」の可能な組み合わせごとに、「表記法」球体の最適な座標が検索され、活性化合物の適切なフラグメントが対応する球体に分類され、非アクティブな球体のフラグメントは分類されません。 難しさ:多くの立体配座に対する分子の3Dジオメトリの正確な決定、すでにテスト済みのかなりの数の化合物の必要性。

画像

定量的構造活性相関(QSARモデリング -数値特性を使用して化合物の構造を記述する場合、接続を見つけるタスクは、典型的な回帰問題(応答が活動である場合)または分類(応答が離散名義の場合)値)。 これらの数値特性は分子記述子と呼ばれ、通常、既製のソフトウェア(Dragon、CDK、MOE、Accelrys discoveryなど)を使用して計算されます。 同時に、分子の構造がどの程度詳細に表現されるかに応じて、0Dから3Dの記述子のグラデーションがあります。 記述子の例は次のとおりです。0D-炭素原子の数、分子量、1D-ヒドロキシル基の数、2D-グラフ理論に基づく記述子。 ウィーナー指数、隣接行列の固有値、3D-最高占有分子軌道のエネルギー、形成熱などの量子化学記述子。 一部のソースは、別の4D記述子を識別します。これらは、点の空間グリッドで計算されたさまざまなポテンシャル(静電、立体)のベクトルです。 後者を使用したQSARモデリングは、3D-QSARと呼ばれます。 機械学習法として最も一般的なのは、多重線形回帰、潜在構造への投影、ニューラルネットワーク(回帰と分類の両方)、およびランダムフォレストです。 他のアルゴリズムもアプリケーションを見つけますが、それほど頻繁ではありません。 多くの場合、分子記述子の数は研究対象の化合物よりもはるかに多いため、変数を選択する方法が使用されます。たとえば、応答との相関の欠如に基づく遺伝的アルゴリズム、段階的回帰、またはスクリーニングです。 難しさ:かなりの数の既にテストされた化合物、3Dおよび4D記述子の必要性は、分子の3Dジオメトリの正確な決定に依存します。



その後、ドッキングモデル、製薬モデル、 QSARモデルが仮想スクリーニング(またはin silicoスクリーニング)に使用されます。 つまり、合成された化合物が実際に存在しない場合、その活性が評価され、したがって、明らかに不活性な膨大な数の化合物が排除され、予測される高活性の化合物が合成され、生物学研究に送られます。 化合物が活性で無毒性の場合、その薬物動態特性(吸収、分布容積、生体内変化と排出の速度-ADME複合体)がさらに検査されます。 QSARモデリングを使用してADMEを予測することもできますが、それはまったく別の話です。



ボーナスはこのトピックには含まれていません。CIS諸国では、薬の化学(海外の薬化学 )が誤って「医療化学」と翻訳されました-今日でも使用されています。



All Articles