ビッグデータと機械学習:医学の新しい機会

MITのRegina Barzilay教授 、ハイテク医療プロジェクトの現状について、「がん治療の種類を選択するよりも、Amazonで靴を選択するための優れた技術を開発しました」 と述べています。 評価は期待はずれです。eコマースなどの「人気のある」領域は、使用されるテクノロジーのレベルの観点から、より社会的に重要な領域の先を行くことがよくあります。



ただし、良いニュースがあります。条件付きの「靴の検索」用に開発されたソリューションは、患者を助けるためにも使用できます。 そして、そのような開発の需要は増え続けています.Frost&Sullivan機関の予測によると、機械学習とビッグデータを使用する医療開発市場の量だけでも年間40%増加し、2021年までに66億ドルに達するでしょう。



今日は、医療プロジェクトでビッグデータがどのように使用され、この方向でどのような開発がITMO大学で行われているかについてお話します。



写真チャールズ・クレッグ CC-BY



病気の診断



特に、データマイニング、機械学習、自然言語処理は、がんや糖尿病から統合失調症に至る病気の早期診断の問題を解決するために積極的に使用されています。 たとえば、American PathAIプロジェクト 、初期段階で乳がんを検出するという素晴らしい仕事をしています。 2016年4月、システムは専門家と競い合って負けました。彼のエラー率は3.5%で、システムのエラー率は7.5%でした。 その瞬間から、研究者はシステムが訓練されたサンプルサイズを増やすことができ、同じ年の11月までにPathAIは診断精度の専門家を上回りました。



ニューヨークのマウントシナイ病​​院のDeep Patientシステムの開発者であるJoel Dudley氏による 、「ディープラーニングの重要な特徴の1つは、予測やモデルを作成するときに、事前に最も重要な情報に限定する必要がないことです」 。 これは、たとえば、治療計画を作成する際の患者の病歴全体の分析に適用されます。 または、個々の患者データを他の症例に関する情報と比較して、Deep Patientアルゴリズムは500万人のデータベースにアクセスします。



救急車の仕事のモデリング



ただし、医療におけるビッグデータの使用はこれらの例に限定されません。 たとえば、ITMO大学では、ビッグデータと医学を組み合わせたプロジェクトの1つが、ハイテクコンピューターテクノロジー研究所によって実施されています。 V.A.にちなんで名付けられたノースウェスタン連邦医療センターと一緒に アルマゾフは、サンクトペテルブルクで救急車の艦隊を管理するためのシステムを開発しています。 このプロジェクトの目的は、派遣者が最も迅速に入院できるよう支援することです。



この問題を解決するために、システムは緊急通報の統計、日中の人口の移動性に関するデータ、輸送ネットワークの負荷に関するデータ、および病院の受付部門に関するデータを考慮します。 その結果、このソリューションでは、まず救急車のルートを最適化し、次に救急車ステーションの規制を改善するための推奨事項を策定することができます。







開発は2つの方向に発展します。一方で、意思決定支援システムは、増加する疾患に関する情報を蓄積します。 一方、プロジェクトは、医療文書の自動化のためのソリューションによって補完されます。



計算生物医学



ちなみに、予測モデリングと医療におけるビッグデータの操作は、テクノロジー適用の特殊なケースではなく、独立した科学的方向性です。 ITMO大学では、その専門家が、マスタープログラム「計算生物医学」の枠組みの中で、高性能コンピューティング部門でトレーニングを受けています。



学部生は、薬物を作成する際に、バイオインフォマティクス、ゲノムおよび疫学研究で使用される方法、アルゴリズム、および技術を研究します。 さらに、トレーニングコースには、人体の生理学的プロセスのモデルの研究、医療機関のプロセス、およびIT専門家とアナリストが医師、生物学者、および化学者と同じ言語で話すことを可能にするその他の基本的な知識が含まれます。



ケモインフォマティクス



化学といえば、医療分野でビッグデータを扱うもう1つの分野は、生物学的および化学的研究であり、関連する分野は化学情報科学です。 たとえば、医薬品用に新しい化合物を作成する場合、多くの実験とテストを実施する必要があります。 Chemoinformaticsでは、最新のデータベースと機械学習アルゴリズムに基づいたモデリングにより、このプロセスを加速できます。



ちなみに、この分野の発展、特にビッグデータの使用は、医療業界全体に重大な変化をもたらしました。 特大のデータセットを作成する必要があるため、製薬会社はを合わせて独立した研究および研究センターと協力するようになります。



この分野でビッグデータを扱うことの「副作用」は、いわゆる忘れられた病気-主にアジア、アフリカ、ラテンアメリカに住んでいる最も貧しく最も疎外された人々の間で一般的な病気を研究するのに十分な量の情報を蓄積する可能性です 。 医薬品の開発とこれらの疾患の研究は、経済的に不利であると考えられています(製薬会社にとって)。 しかし、ビッグデータへのアクセス、特に化学化合物と反応のオープンデータベースの出現は、プロセスのコストを大幅に削減し、愛好家のグループに、少なくとも大製薬会社の初期支援なしで、そのような問題の解決に独自に取り組む機会を与えます。



ITMO大学では、この分野を研究し、ストラスブール大学と共同で実施される修士プログラム化学情報学と分子モデリング」の枠組み内で独自のプロジェクトに取り組むことができます。 将来のマスターは、化学的および生物学的特性を予測し、反応​​の経過を予測し、新薬を見つける問題を解決するために、化合物および反応のデータベースを構築および分析する方法の使用 (および開発)を学びます。



All Articles