RNAInSpaceとフォールディングtRNA-シーズンの終わり、新しいシーズン-構造的整合性

そして今、1年半も経たないうちに、tRNAの三次構造を収集することができました。 以前に、このテーマに関する記事 RNAInSpaceの開発、CRAアルゴリズム、Linux上のコードの問題など」を書いたことを思い出してください。 私は約1年間これをやらなかったと言わなければなりませんが、この間、このトピックに関する2回目の科学記事「リボ核酸の折り畳みのタスクへのゲーム理論の適用」が公開されました (これは専門的に話したい人向けです)。 しかし最近、tRNAの三次構造を取得し、生物学的手法(結晶学)によって得られたデータベース(PDB)で利用可能なサンプルと比較したと言うことができます。



カットの下には、tRNAの3D構造の図面、説明、および将来の計画があります。



tRNAの三次構造-結果











折り畳みローラーを作成することは可能ですが、私はあまりにも面倒でした-例として、これを見 、次にこれを見ることができ、折り畳みは図に示すようにチェーンをtRNAに変えます



2つの角度から見たtRNAの図。 緑は私が得たモデルであり、赤はPDBデータベースからのモデルです。 これで専門家にRMSD = 6.71(これは2つのモデルの類似性の尺度です)であることがわかります。 ご覧のとおり、全体的なプロファイルはほぼ同じです。 また、私のモデルでは、ほとんどすべての標準的な水素結合が形成され、非標準的な水素結合は形成に近づいています。



誰かが私の記事をすでに読んでいる場合は、覚えておいてください、可能であれば、水素結合の場所を予測し、重要なスタッキングサイトを見つけるために、三次モデルは一次構造(いわゆるde novo)のみに基づいて取得されます。 興味があれば、詳細を説明し、これらの結果について議論する準備ができています。



シーズン終了



私の活動のこの方向性を特定の論理的な結論に導きました。この記事では、Habréで書いた一連の記事を閉じたいと思います。 本質的に、私は自分の目標を達成しました。 そして、ここでこの論文について説明します。



1.インターネットに関する最初の記事は2009年に作成されました。 その中で、折り畳みのタスクは、サイバネティックなアイデアの精神に基づいています。

2.次に、 Wikiversityでオープンプロジェクトを開発しようとしました。



主な論文は次のとおりです。「 特定の最低限しか知らず、生物学、物理学、または化学の専門教育を受けていない場合、深刻な結果を得ることができます 。」 今、私は深刻な結果を得たことに疑いの余地はなく、私が得た方法は現在存在する他のすべての方法よりも優れています。



紳士だから、始めることを恐れてはいけない。途中で、知識はほとんどないが、博識を示す準備ができている人々に対する多くの反対と批判に会うだろう。 結果がある場合は、退却する必要があります。



3.私はこの方向で多くの現代的なアプローチを放棄しなければなりませんでした。時々、方法は問題を解決するために使用されず、この方法またはその方法がどのように機能するかを示すために感じさえしました そして、最初に人工知能法を含むいくつかの方法に希望があれば、それらは良くないことが判明しました。 ゲーム理論とエージェントアプローチの一般的なイデオロギーのみが適しています。 したがって、目的関数を見つける際の特定のヒューリスティックに帰着します(もちろん、詳しく説明すると、私が開発したアルゴリズムには小さな利点があります-しかし、これはこの記事ではありません-これは問題に没頭するレベルではありません)。



4.査読付きジャーナルの2つの記事-個人的には、このトピックについては十分です。 ご清聴ありがとうございました。

5.実際、私は方法とアプローチを開発しましたが、現在は技術とフォロワー次第です。



6.次に、「何のために、なぜ」という質問に行きます。 これについては、次のセクションで説明します。



「生きているものと生きていないものの違い」



その最初の記事でさえ、RNAの3次元構造を研究する理由の質問に対する答えが与えられました(これはそれ自体が興味深いことに加えて、生物学者にとって有用かもしれません)。



私たちには明確な生物学的課題があります:「50-100ヌクレオチドRNA鎖の3次元構造の変化と正確な変化を正確に調べることは、このRNA鎖がリボザイムであるという事実に根本的に影響します。」 言い換えれば、リボザイムのどの変異が、自己複製の可能性を、それらの不在まで改善または悪化させるかです。 そして大衆化-これは、生きているものと生きていないものを区別するものの質問に対する詳細な答えになります。




もちろん、今振り返ってみるとやや素朴です。 それにもかかわらず、それは特定の意味を持ちます。 明確にしようとします。



シーケンスアラインメントの現代の理論は本質的に誤りであり、実際の結果を得るのではなく、結果を本質的に調整できることを何度も指摘しました。 また、生物学的データベースの注釈には多くのエラー「配列された生物のゲノム-データベースのエラーが含まれており、そこで働く人々は同意することを余儀なくされたと書きました。



さて、振り返ってみると、バイオインフォマティクスの本質を知らずに、最初の記事で、いわゆる 構造的アライメント。 これは、ゲノム内の遺伝子の発見、および個々のヌクレオチドの変異とその統計を考慮せず、機能的に類似した遺伝子の三次構造に焦点を当てたゲノム配列のその後の比較です。



確かに、現在、三次構造を取得するための私のアプローチにより、特定のヌクレオチド配列を1つまたは別の構造に折り畳むことができるかどうかを判断できます。 これは、ヌクレオチド配列のどの部分が保存的であるべきか、どの変異が可能かを理解することが可能であることを意味します。



同じtRNA、リボザイム、または他のRNA構造の機能に実際に影響するこの情報はすべて、単純な分析(アライメント)には使用されません。三次構造の機能について。 そして現在、これに普遍的に使用されている統計的アプローチは、この問題をさらに曖昧にしている。



そして今、(おおよそ)三次構造がわかったら-構築することができます-それを呼び出しましょう-機能的プロファイル、例えば、tRNA。 そしてその後、そしてその後だけ-すべてのtRNAの位置をDNAで十分な精度で見つけることができます。



しかし、この機能プロファイルを作成するのはそれほど簡単ではありません。 保守的なプロットは100%しかありません。ほとんどすべてが絶対値で変化する可能性があります。 これを理解するために、tRNAの例を検討してください。



次に、2つのtRNAを比較しましょう。



gcgcggauagcucagucgguagagcaggggauugaaaauccccguguccuugguucgauuccgaguccgcgc

gcggauuuagcucaguugggagagcgccagacugaagucuggagguccuguguucgauccacagaauucgca



これら2つのtRNAを並べて、それらがどのように異なるかを言ってみてください。 実際には、問題はさらに深刻です-これらのシーケンスは、この例のように強調表示されていません-それらは、数百万の類似したgcau文字の中にあります。 また、tRNAが必要な場所もわかりません。



もちろん、ナンセンスに取り組み、これらの兆候を揃えて、突然変異中にギャップや挿入が発生した場所を仮定することができます。



しかし、少なくとも古典的なものから始めて、もっと簡単なことをすることができます。水素結合を見つけましょう。 取得するもの:



((((((((..((((........))))。((((((((...))))).....(( (((.......)))))))))))))

((((((((..((((........))))。(((((((....))))).....((( ((.......)))))))))))))。)



もっと楽しくなっていませんか? 違いはそれほど大きくないことがわかります。 許容差は、プラスまたはマイナス1〜3ポイント(不対のヌクレオチド)および1〜3ペアのブラケット(水素結合とペアのヌクレオチド)に対して作成する必要があります。 より高い精度を得るために、非標準的な水素結合(構造を3Dレベルで安定化する)の対応を見つけることができます。



もちろん、何百万ものgcauの兆候の中からこれらの構造を見つけることは依然として困難です。 しかし、ここにはガイドラインがあります。 タスクを部分に分割し、すべてのtRNAではなく、フェニルアラニンをもたらすtRNAを探します。 そして、中央に確実にシーケンスgaaがあることがわかっているので。 次に、gaaの中央に対応するプロファイルを持つゲノム内のすべてのそのような配列を検索できます。



((((((((..((((........))))。(((((((((gaa)))))).....(((( (.......))))))))))))))

((((((((..((((........))))。(((((((gaa。))))).....((((( .......))))))))))))))。



構造に許容限度があります。



それが近い将来に私がやろうとしていることです-配列決定された細菌ゲノム内のすべてのtRNAを確実に見つけるためです。 たぶん誰かがこれに参加したい-私は招待します。



All Articles