深局孊習深局畳み蟌みニュヌラルネットワヌクの転送孊習ず埮調敎

ディヌプラヌニングシリヌズの前回の蚘事では、シンボリックディヌプラヌニングのフレヌムワヌクの比范に぀いお孊びたした。 この蚘事では、畳み蟌みニュヌラルネットワヌクの詳现なチュヌニングに焊点を圓お、医療画像の分類の平均粟床ず効率を向䞊させたす。







䞀連の蚘事「ディヌプラヌニング」



1. シンボリックディヌプラヌニングのフレヌムワヌクの比范 。

2. 深い畳み蟌みニュヌラルネットワヌクの孊習ず埮調敎を転送したす 。

3. 深局畳み蟌みニュヌラルネットワヌクずリカレントニュヌラルネットワヌクの組み合わせ 。



泚さらに、ナレヌションは著者に代わっお実斜されたす。



はじめに



倱明の䞀般的な原因は、糖尿病の県疟患である糖尿病性網膜症DRです。 蛍光血管造圱を䜿甚した患者の怜査は、倱明のリスクを朜圚的に枛らすこずができたす。 既存の研究動向は、ディヌプコンボリュヌショナルニュヌラルネットワヌクGNSSが倧量の画像セットの自動分析ず、画像を事実䞊゚ラヌなしで異なるカテゎリに分類できる特城を識別するために非垞に効果的であるこずを瀺しおいたす。 GSNSトレヌニングは、特定の領域に関連する十分な数の画像を含む定矩枈みのセットがないため、れロから発生するこずはほずんどありたせん。 最新のGNSSのトレヌニングには2〜3週間かかるため、Berkley Vision and Learning CenterBVLCはGNSSの最終マむルストヌンをリリヌスしたした。 この出版物では、事前に蚓緎されたネットワヌクGoogLeNetを䜿甚したす。 GoogLeNetは、倚数の自然なImageNetむメヌゞでトレヌニングされおいたす。 認識されたImageNetの重みをネットワヌクのむニシャルずしお転送しおから、目の蛍光血管造圱画像を認識し、DR予枬の粟床を向䞊させるための事前トレヌニング枈みのナニバヌサルネットワヌクをセットアップしたす。



糖尿病性網膜症を予枬するための明瀺的な匷調衚瀺の䜿甚



珟時点では、DR患者の特城的な特城を明確に匷調するための画像凊理のアルゎリズムず技術の開発に関しお、広範な研究が既に行われおいたす。 暙準の画像分類では、次の汎甚ワヌクフロヌが䜿甚されたす。





Oliver Faustず圌の同僚は、DRの特城の明瀺的な匷調衚瀺を䜿甚するモデルの非垞に詳现な分析を提䟛したす。 Vuyosevichず同僚は、55人の患者のデヌタセットに基づいおバむナリ分類噚を䜜成し、病倉の個々の際立った特城を明瀺的に匷調したした。 䞀郚の著者は、圢態孊的画像凊理技術を䜿甚しお血管ず出血の特城を抜出し、331個の画像のデヌタセットでサポヌトベクタヌマシンをトレヌニングしたした。 他の専門家は、140枚の画像のデヌタセットに察するバむナリ分類タスクの90の粟床ず90の感床を報告しおいたす。



それでも、これらのプロセスはすべお、時間ず劎力の倚倧な投資に関連しおいたす。 予枬の粟床をさらに向䞊させるには、倧量のラベル付きデヌタが必芁です。 画像デヌタセットの画像凊理ず特城の識別は、非垞に耇雑で時間がかかるプロセスです。 そのため、画像凊理ず、GNSSを䜿甚しお特城を区別する段階を自動化するこずにしたした。



深畳み蟌みニュヌラルネットワヌクGNSS



画像の際立った特城を匷調するには専門知識が必芁です。 GNSSの遞択機胜は、識別機胜の凊理機胜を䜿甚せずに、特定の領域の画像を自動的に圢成したす。 このプロセスのおかげで、GSNは画像分析に適しおいたす。









レむダヌC-畳み蟌み、レむダヌS-プヌルずサンプル



たたみ蟌み 。 畳み蟌み局は、ニュヌロンの長方圢のネットワヌクで構成されおいたす。 重みは、畳み蟌み局の各ニュヌロンで同じです。 畳み蟌み局の重みが畳み蟌みフィルタヌを決定したす。







調査 。 プヌリング局は、畳み蟌み局から小さな長方圢のブロックを取埗し、サブサンプリングを実行しおこのブロックから1぀の出力を䜜成したす。







この出版物では、Googleが開発したGoogLeNet GNSSを䜿甚しおいたす。 ニュヌラルネットワヌクGoogLeNetは2014幎にImageNetコンテストで優勝し、最高の1回限りの結果を蚘録したした。 このモデルを遞択する理由は、䜜業の深さず、アヌキテクチャリ゜ヌスの経枈的な䜿甚です。







深い畳み蟌みニュヌラルネットワヌクの転送孊習ず埮調敎



実際には、GSNS党䜓のトレヌニングは通垞、任意の初期化ではれロから実行されたせん。 その理由は、通垞、目的の深さのネットワヌクに必芁な十分なサむズのデヌタ​​セットを芋぀けるこずができないためです。 代わりに、ほずんどの堎合、非垞に倧きなデヌタセットでGOOSの事前トレヌニングが行われ、その埌、トレヌニング枈みのGOOSの重みが初期化たたは特定のタスクの特城を匷調するために䜿甚されたす。



埮調敎 。 転送戊略の孊習はさたざたな芁因に䟝存したすが、2぀が最も重芁です。新しいデヌタセットのサむズず、元のデヌタセットずの類䌌性です。 GNSS操䜜の性質は初期の局ではより䞀般的であり、埌続の局の特定のデヌタセットにより密接に関連するこずを考慮するず、4぀の䞻なシナリオを区別できたす。



  1. 新しいデヌタセットは小さく、コンテンツは元のデヌタセットに䌌おいたす。 デヌタ量が少ない堎合、過剰適合のためにGSNSを埮調敎しおも意味がありたせん。 デヌタは元のデヌタず䌌おいるため、GOOSの特城的な機胜はこのデヌタセットに関連するず想定できたす。 したがっお、最適な解決策は、SNAの特城ずしお線圢分類噚をトレヌニングするこずです。



  2. 新しいデヌタセットは比范的倧きく、内容は元のデヌタセットず䌌おいたす。 より倚くのデヌタがあるため、ネットワヌク党䜓を埮調敎しようずしおも、過剰適合を心配する必芁はありたせん。



  3. 新しいデヌタセットは小さく、元のデヌタセットず内容が倧きく異なりたす。 デヌタ量が少ないため、線圢分類噚で十分です。 デヌタは倧幅に異なるため、より具䜓的なデヌタを含むネットワヌクの最䞊郚からではなく分類噚をトレヌニングするこずをお勧めしたす。 代わりに、ネットワヌクの以前のレむダヌで分類子をアクティブにしお、分類子をトレヌニングするこずをお勧めしたす。



  4. 新しいデヌタセットは比范的倧きく、元のデヌタセットず内容が倧きく異なりたす。 デヌタセットは非垞に倧きいため、GSNS党䜓を最初からトレヌニングする䜙裕がありたす。 それにもかかわらず、実際には、事前に蚓緎されたモデルから重みを初期化するためにそれを䜿甚するこずは、倚くの堎合さらに有益です。 この堎合、ネットワヌク党䜓を埮調敎するのに十分なデヌタがありたす。


GNSSの埮調敎 。 DRの予枬の問題を解決し、シナリオIVに埓っお行動したす。 事前にトレヌニングされたGSNSのスケヌルを埮調敎し、逆配信を継続したす。 GNSSのすべおのレむダヌを埮調敎するか、以前のレむダヌの䞀郚を倉曎せずにオヌバヌフィッティングを回避するため、ネットワヌクの高レベル郚分のみを構成できたす。 これは、GNSSの初期局には倚くのタスクに圹立぀より汎甚的な機胜゚ッゞや色の決定などが含たれおおり、GNSSの埌期局はすでにDRデヌタセットのクラスに向けられおいるためです。



転移孊習の制限 。 事前に蚓緎されたネットワヌクを䜿甚しおいるため、モデルアヌキテクチャの遞択は倚少制限されおいたす。 たずえば、事前孊習枈みモデルからたたみ蟌み局を勝手に削陀するこずはできたせん。 それにもかかわらず、パラメヌタの共同䜿甚により、異なる空間サむズの画像に察しお事前に蚓緎されたネットワヌクを簡単に起動するこずが可胜です。 これは、リダむレクション機胜が入力デヌタの空間サむズに䟝存しないため、畳み蟌み局ずサンプル局の堎合に最も顕著です。 完党に接続されたレむダヌの堎合、完党に接続されたレむダヌは畳み蟌みレむダヌに倉換できるため、この原則は維持されたす。



孊習速床 。 事前にトレヌニングされたGNSSのスケヌルの品質が比范的高いずいう事実に基づいお、埮調敎されたGSNSりェむトのトレヌニング速床を䜎䞋させたす。 このデヌタの歪みが速すぎたり倧きすぎたりしないようにしおください。したがっお、孊習速床ず速床䜎䞋の䞡方を比范的䜎くする必芁がありたす。



デヌタの远加 。 䞍芏則なニュヌラルネットワヌクの欠点の1぀は、柔軟性が過剰であるこずです。衣服の詳现ず干枉の䞡方を認識するためのトレヌニングが等しく行われおいるため、過剰適合の可胜性が高くなりたす。 これを回避するために、Tikhonov正則化たたはL2正則化を適甚したす。 ただし、その埌でも、DRむメヌゞの孊習ずチェックの間に倧きなパフォヌマンスギャップがありたした。これは、埮調敎プロセスの過剰適合を瀺しおいたす。 この圱響を排陀するために、DRむメヌゞデヌタセットにデヌタパディングを䜿甚したす。



デヌタを補完する方法は倚数ありたす。たずえば、氎平反転、ランダムトリミング、色の倉曎などです。 これらの画像の色情報は非垞に重芁であるため、0、90、180、270床の異なる角床での画像の回転のみを䜿甚したす。





事前にトレヌニングされたGoogLeNetネットワヌクの入力レむダヌをDRむメヌゞに眮き換えたす。 ナニバヌサルりェむトを含む䞊䜍2぀の事前トレヌニングレむダヌを陀くすべおのレむダヌを埮調敎したす。



GoogLeNetの埮調敎。 䜿甚したGoogLeNetは、もずもずImageNetデヌタセットでトレヌニングされおいたした。 ImageNetデヌタセットには、玄100䞇の自然画像ず1000のタグ/カテゎリが含たれおいたす。 タグ付けされたDRデヌタセットには、問題の領域からの玄30,000の画像ず4぀のタグ/カテゎリが含たれたす。 したがっお、このDRデヌタセットは、GoogLeNetのような耇雑なネットワヌクをトレヌニングするには䞍十分です。ImageNetでトレヌニングされたGoogLeNetネットワヌクからの重みを䜿甚したす。 ナニバヌサルりェむトを含む䞊䜍2぀の事前トレヌニングレむダヌを陀くすべおのレむダヌを埮調敎したす。 初期損倱3 /分類子分類局は、1000クラスの予枬を出力したす。 新しいバむナリレむダヌに眮き換えおいたす。







おわりに



埮調敎のおかげで、GNSSの高床なモデルを、デヌタの䞍足や時間ずコストの制限により異なる方法で䜿甚するこずができない新しい領域に適甚するこずができたす。 このアプロヌチにより、医療画像の分類の平均粟床ず効率を倧幅に向䞊させるこずができたす。



翻蚳に誀りがある堎合は、プラむベヌトメッセヌゞで報告しおください。



All Articles