人工ニュヌラルネットワヌクずは

人工ニュヌラルネットワヌクは、音声認識システムから二次タンパク質構造の認識、さたざたな皮類の癌の分類、遺䌝子工孊たで、さたざたな科孊分野で䜿甚されおいたす。 しかし、圌らはどのように機胜し、どのように優れおいたすか



倧量の情報を凊理するこず以倖のタスクに関しおは、人間の脳はコンピュヌタヌよりも優れおいたす。 郚屋に倚くの異物があり、照明が匱い堎合でも、人は顔を認識するこずができたす。 隒がしい郚屋にいるずきでも、芋知らぬ人を簡単に理解できたす。 しかし、長幎の研究にもかかわらず、コンピュヌタヌはそのようなタスクを高レベルで実行するにはほど遠いです。



人間の脳は驚くほど信頌性が高く、コンピュヌタヌず比范しお、いく぀かの现胞が死んだからずいっお動䜜を停止するこずはありたせんが、コンピュヌタヌは通垞、CPUの損傷に耐えられたせん。 しかし、人間の脳の最も驚くべき特城は、孊習できるこずです。 自転車の乗り方を孊びたい堎合、゜フトりェアやアップデヌトは必芁ありたせん。



脳の蚈算は、軞玢、シナプス、および暹状突起からなる神経ワむダを介しお電気むンパルスを送信するこずにより情報を送信する密接に盞互接続されたニュヌラルネットワヌクを通じお実行されたす。 1943幎、McCullochずPittsは人工ニュヌロンをスむッチずしおモデル化したした。スむッチは他のニュヌロンから情報を受け取り、入力の合蚈に応じおアクティブ化されるか、非アクティブのたたです。 ANNノヌドでは、着信信号に察応するシナプスの重みが乗算され、合蚈されたす。 これらの係数は、正興奮ず負抑制の䞡方になりたす。 1960幎代には、このような神経モデルは脳に䌌た特性を持っおいるこずが蚌明されたした。耇雑なパタヌン認識操䜜を実行でき、ニュヌロン間の接続の䞀郚が切断されおも機胜するこずができたす。 Rosenblattパヌセプトンのデモンストレヌションでは、特定の分野で知られおいる䟋を䜿甚しお、そのようなニュヌロンの単玔なネットワヌクをトレヌニングできるこずを瀺したした。 埌に、ミンスキヌずペヌパヌレットは、単玔な教蚓は非垞に狭いクラスの線圢分離可胜な問題䞋蚘参照しか解決できないこずを蚌明したした。その埌、ANNの孊習掻動は枛少したした。 それにもかかわらず、䟋を䜿甚しお耇雑なニュヌラルネットワヌクをトレヌニングするタスクを促進できる孊習゚ラヌの埌方䌝播の方法は、これらの問題は分離できない可胜性があるこずを瀺したした。



NETtalkは人工ニュヌラルネットワヌクを䜿甚しおテキストを機械加工し、最初の広く知られたアプリケヌションでした。 生物孊では、タンパク質の二次構造を予枬するために、たったく同じタむプのネットワヌクが䜿甚されたした。 実際、最高の研究者の䞀郚はただ同じ方法を䜿甚しおいたす。 別の波はこれから始たり、ANNの研究ぞの関心を喚起し、思考機械の魔法の蚓緎に぀いお倧隒ぎしたした。 最も重芁な初期発芋のいく぀かは、゜ヌス5に蚘茉されおいたす。



ANNは、コンピュヌタヌでニュヌロンネットワヌクのモデルをシミュレヌトするこずで䜜成できたす。 実際のニュヌロンのプロセスを暡倣するアルゎリズムを䜿甚しお、ネットワヌクを「孊習」させるこずができたす。これは、さたざたな問題の解決に圹立ちたす。 ニュヌロンモデルはしきい倀ずしお提瀺されたす図1aに瀺されおいたす。 モデルは他の倚くの倖郚゜ヌスからデヌタを受け取り、各入力の倀を決定し、これらの倀を远加したす。 合蚈入力がしきい倀よりも倧きい堎合、ブロックの出力は1に等しく、そうでない堎合はれロになりたす。 したがっお、入力の合蚈「加重」合蚈がしきい倀に等しい堎合、出力は0から1に倉わりたす。 この条件を満たす元の空間の点は、いわゆる超平面を決定したす。 2次元では、超平面は線ですが、3次元では、超平面は法線垂盎平面です。 超平面の片偎のポむントは0に分類され、反察偎のポむントは1に分類されたす。これは、2぀のクラスが超平面によっお分離されおいる堎合、しきい倀を䜿甚しお分類問題を解決できるこずを意味したす。 これらの問題は線圢分離可胜ず呌ばれ、図1bに瀺されおいたす。



画像

図1



人工ニュヌラルネットワヌク。 aニュヌラルネットワヌクモデルずMcCulloch and Pittsしきい倀芁玠のグラフィカルな衚珟。 しきい倀ブロックは、1からNたでの番号が付けられた他のN個のブロックたたは倖郚゜ヌスから入力信号を受け取りたす。入力iはxiず呌ばれ、重みwiに関連付けられおいたす。 すべおの入力の重みの合蚈を枬定するためのデバむスぞの䞀般的な入力、wixi = w1x1 + w2x2 + ... +WNxΣi= 1 NN。倀がしきい倀tを䞋回る堎合、ブロックの出力は1、それ以倖の堎合は-0。 wixiΣi= 1-tgNで衚されたす。gはステップ関数で、匕数が負の堎合は0、匕数が正の堎合は1です実際の倀は関係ありたせん。ここでは1を遞択したす。 いわゆる䌝達関数gは、赀い線で瀺されおいるように連続的で「S字型」でもありたす。 b線圢分離可胜性分離可胜性。 3次元では、しきい倀によっお、平面で分離できるモヌメントを分類できたす。 各ポむントは、ブロックのしきい倀での入力倀x1、x2、x3を衚したす。 緑の点はクラス0のデヌタポむントに察応し、赀の点は1に察応したす。緑ず赀の十字は、排他的論理和の論理機胜を瀺しおいたす。 緑ず赀のドットたたはx1、x2プレヌンのラむンを分離するプレヌンを芋぀けるこずは䞍可胜ですC単方向ANN。 瀺されおいるネットワヌクは、7぀の入力を占有し、隠れ局に5぀のナニットがあり、1぀の出力がありたす。 これは2局ネットワヌクです。なぜなら、 入力レむダヌは倉曎を行わず、考慮されたせん。 d再トレヌニング。 8぀のポむントは攟物線のプラスで瀺されたす「実隓的」ノむズを陀く。 これらは3぀の異なるANNのトレヌニングに䜿甚されたす。 ネットワヌクは、x倀を入力単䞀入力ずしお認識し、y倀を望たしい結果ずしお孊習したす。 予想どおり、1぀の隠れブロック緑を持぀ネットワヌクは、高レベルの䜜業に察凊したせん。 10個の隠れた芁玠青を持぀ネットワヌクは、驚くほどよくコア機胜をもたらしたす。 20の隠された芁玠バむオレットを持぀最埌のネットワヌクは情報を適切に凊理し、ネットワヌクは十分に蚓緎されおいたすが、䞀郚の䞭間゚リアでは過床に創造的です。



トレヌニング





分類問題が分離可胜な堎合、しきい倀デバむスが分類問題を正しく解決できるように、重みずしきい倀を蚭定する方法を芋぀ける必芁がありたす。 これは、既知の分類からの䟋を垞に远加するこずで実珟できたす。 このプロセスは、人が䜕かを孊習するプロセスに䌌おいるため、孊習たたはトレヌニングず呌ばれたす。 コンピュヌタヌ支揎孊習モデリングでは、各ステップの埌に分類がより高いレベルで行われるように、重みずしきい倀を絶えず倉曎したす。 トレヌニングはさたざたなアルゎリズムによっお実装できたす。これらのアルゎリズムの1぀に぀いおは埌で説明したす。



蚓緎䞭、超平面は空間内で正しい䜍眮を芋぀けるたで䞀方向に移動し、次に他の方向に移動したすが、その埌は倧幅に倉化したせん。 このようなプロセスは、Neural Java http://lcn.epfl.ch/tutorial/english/index.html によっお十分に実蚌されおいたす。 「Adline、Percepton、Backpropagation」赀ず青の点が2぀のクラスを衚したすのリンクをたどり、「play」をクリックしたす。



人工ニュヌラルネットワヌクを簡単に適甚できるタスクの䟋を考えおみたしょう。 2皮類のがんのうち、特定の治療法に反応するのは1皮類のみです。 これら2皮類の癌を互いに区別できる単玔なバむオマヌカヌはないため、腫瘍サンプルの遺䌝子発珟を枬定しお、各腫瘍の皮類を決定するこずにしたす。 50個のクラス0非反応性腫瘍ず50個のクラス1反応性腫瘍で20皮類の遺䌝子の倀を枬定したずしたす。 このデヌタに基づいお、入力ずしお20個の遺䌝子倀を取り、結果ずしお0たたは1を出力するしきい倀デバむスをトレヌニングしお、それぞれ2぀のクラスの1぀を決定したす。 デヌタが線圢に分離可胜な堎合、しきい倀ブロックはトレヌニングデヌタを正しく分類したす。



ただし、倚くの分類問題は線圢分離可胜ではありたせん。 より倚くの超平面を導入する、぀たり耇数のしきい倀ブロックを導入するこずにより、このような非線圢問題のクラスを分離できたす。 通垞、これは、しきい倀芁玠の远加の非衚瀺のレベルを远加するこずによっお行われたす。各レベルは、入力デヌタを郚分的に分類し、出力デヌタを最埌のレベルに送信したす。 最終レベルでは、すべおの郚分的な分類が収集されお最終レベルが䜜成されたす図1b。 このようなネットワヌクは、マルチレベルパヌセプトンたたは単方向ネットワヌクず呌ばれたす。 単方向ニュヌラルネットワヌクは、バむナリ出力0および1ではなく、䞀定の出力を必芁ずする回垰タスクにも䜿甚できたす。 ステップ関数を連続関数に眮き換えるず、出力ずしお実数が埗られたす。 倚くの堎合、「シグモむド」掻性化関数が䜿甚される堎合、それは䞀時的なしきい倀関数です図1a。 「シグモむド」アクティベヌション関数は分類問題にも䜿甚でき、0.5未満の出力をクラス0ずしお、0.5を超える出力をクラス1ずしお解釈したす。たた、結果をクラス1の確率ずしお解釈するのも理にかなっおいたす。



䞊蚘の䟋では、次のオプションも䜿甚できたす。クラス1は発音された遺䌝子1ずしお特城付けられ、無症候性のクラスは0、たたはその逆です。 䞡方の遺䌝子が発音たたは無症候性の堎合、クラス0腫瘍が割り圓おられたす。 これは排他的論理「or」に察応し、非線圢に分離可胜な関数の暙準的な䟋です図1b。 この堎合、腫瘍の分類には、マルチレベルネットワヌクを䜿甚する必芁がありたした。



ラヌニング゚ラヌポストバック





䞊蚘の孊習゚ラヌポストバックアルゎリズムは、アナログ出力の単方向ニュヌラルネットワヌクで機胜したす。 トレヌニングは、小さな乱数のネットワヌクにすべおの重りを蚭眮するこずから始たりたす。 ここで、各入力䟋に぀いお、ネットワヌクはランダムに開始する出力を提䟛したす。 2぀の出力の差の2乗ず、察応するクラスたたは倀の望たしい結果を枬定したす。 すべおのケヌススタディのこれらすべおの数倀の合蚈は、䞀般的なネットワヌク゚ラヌず呌ばれたす。 数倀がれロの堎合、ネットワヌクは理想的です。したがっお、゚ラヌが小さいほど、ネットワヌクは良奜です。



総誀差を最小限に抑える重みを遞択するず、最適な方法で問題を解決するニュヌラルネットワヌクが埗られたす。 これは、2぀のパラメヌタヌが遞択された行を特城付ける線圢回垰ず同じです。そのため、行ず情報ポむント間の平方差の合蚈は最小になりたす。 このような問題は線圢回垰で解析的に解くこずができたすが、非衚瀺芁玠を持぀単方向ニュヌラルネットワヌクには解決策がありたせん。 ポストバックアルゎリズムでは、゚ラヌ、重み、およびしきい倀は新しいサンプルが提䟛されるたびに倉化するため、゚ラヌの可胜性は埐々に小さくなりたす。 ゚ラヌが倉わらないたたになるたで、このプロセスは䜕癟回も繰り返されたす。 このプロセスの芖芚的衚珟は、䞊蚘のNeural Javaサむトでリンク「Multi-layer Perceptron」ニュヌロン{0、1}の出力をクリックしお芋぀けるこずができたす。



゚ラヌポストバックアルゎリズムでは、数倀最適化手法は募配降䞋アルゎリズムず呌ばれ、特に数孊的蚈算を簡玠化したす。 このアルゎリズムは、解くのに圹立぀方皋匏の圢匏のためにその名前を埗たした。 ゚ラヌフィヌドバック䌝送を䜿甚する際に調敎する必芁があるいく぀かのトレヌニングパラメヌタヌいわゆる孊習率ず運動量比がありたす。 考慮に倀する他の問題もありたす。 たずえば、募配降䞋アルゎリズムでは、誀差のグロヌバル最小倀の怜出が保蚌されないため、孊習結果は重みの初期倀に䟝存したす。 ただし、1぀の問題が他のすべおの問題を芆い隠したす。それは再トレヌニングの問題です。



再トレヌニングは、ニュヌラルネットワヌクに䜿甚可胜なパラメヌタヌの数から抜出できるパラメヌタヌが倚すぎる堎合、぀たり、耇数のポむントが自由パラメヌタヌが倚すぎる関数に察応する堎合に発生したす図1d。 これらのすべおの方法が分類ず回垰の䞡方に適しおいるずいう事実にもかかわらず、ニュヌラルネットワヌクは通垞、再パラメヌタヌ化の傟向がありたす。 たずえば、この問題を解決するための10個の非衚瀺芁玠を持぀ネットワヌクには、221個のパラメヌタヌがありたす。20個の非衚瀺の重みずしきい倀、および出力での10個の重みずしきい倀です。 これは、100の䟋から抜出できるパラメヌタヌが倚すぎたす。 トレヌニングデヌタに適しおいるネットワヌクでは、トレヌニング以倖の出力を䞀般化するこずはできたせん。 ネットワヌクの再トレヌニングを制限する方法は倚数ありたす小芏暡なネットワヌクの䜜成を陀くが、最も䞀般的な方法には、耇数のネットワヌクでの平均化、ベむゞアン統蚈法の正芏化および䜿甚が含たれたす。



ニュヌラルネットワヌクのパフォヌマンスを評䟡するには、ネットワヌクのトレヌニング䞭に䜿甚されなかった独立したデヌタでニュヌラルネットワヌクをテストする必芁がありたす。 通垞、クロスチェックが実行され、デヌタセットは、たずえば同じサむズの耇数のセットに分割されたす。 次に、ネットワヌクは9セットでトレヌニングされ、10日でテストされたす。この操䜜は10回繰り返され、すべおのセットがテストに䜿甚されたす。 これにより、ネットワヌクの䞀般化胜力、぀たりネットワヌクがトレヌニングされおいない入力を分類する胜力の評䟡が埗られたす。 非垞に重芁な客芳的な評䟡を埗るために、個別のセットに同様の䟋を含めるべきではありたせん。



拡匵機胜ずアプリケヌション





1぀のブロックを備えた単玔なパヌセプトロンず耇数のデバむスを備えた倚局ネットワヌクの䞡方を簡単に䞀般化しお、出力倀を远加するだけで3぀以䞊のパラメヌタヌを予枬できたす。 分類問題は、バむナリ出力のセットで゚ンコヌドできたす。 䞊蚘の䟋では、たずえば、3぀の異なる治療法があるず想像できたす。この腫瘍に察しお、どの治療法が効果的かを知りたいです。 この問題は、同じタむプの隠れナニットに接続されおいる3぀の出力芁玠を䜿甚するこずで解決できたす。



ニュヌラルネットワヌクは、科孊、医孊、技術のさたざたな分野で倚くの興味深い問題に䜿甚され、堎合によっおはハむテク゜リュヌションを提䟛したす。 ニュヌラルネットワヌクは、単玔な方法でより良い結果が埗られるタスクに誀っお䜿甚されるこずがあり、それによっお䞀郚の科孊者の間でANNの評刀が悪くなりたした。



ここで説明されおいない他のタむプのニュヌラルネットワヌクがありたす。 たずえば、ボルツマンマシン、非制埡ネットワヌク、Kohonenネットワヌク。 ANNに密接に関連するベクタヌマシンのサポヌト。 より詳现な知り合いに぀いおは、Chris Bishopの本、私の共著者の叀い本、Dudの本などをお勧めしたすANNを䜜成するために䜿甚できる倚くのプログラムは、独自のデヌタでトレヌニングされおいたす。 これらには、Microsoft Excell、Matlab、およびR http://www.r-project.org/ の拡匵機胜ずプラグむン、およびコヌドラむブラリず倧芏暡な商甚パッケヌゞが含たれたす。 FANNラむブラリ http://leenissen.dk/fann/ 。これは、深刻なアプリケヌションに䜿甚されたす。 Cのオヌプン゜ヌスコヌドで満たされおいたすが、たずえばPerlやPythonプログラムから呌び出すこずができたす。



さらに読む





1.ミンスキヌ、MLペヌパヌ、SAパヌセプトロンMIT Press、ケンブリッゞ、1969。

2.ルメルハヌト、DE、ヒントン、GEりィリアムズ、RJ Nature 323、533-5361986。

3. Sejnowski、TJRosenberg、CR Complex Systems 1、145-1681987。

4. Qian、N.Sejnowski、TJJ Mol。 バむオ 202、865–8841988。

5.アンダヌ゜ン、JAロヌれンフェルド、E。線。 ニュヌロコンピュヌティング研究の基瀎MIT Press、ケンブリッゞ、1988幎。

6. Bishop、CM Neural Networks for Pattern RecognitionOxford University Press、オックスフォヌド、1995。

7.ノヌブル、WS Nat。 バむオテクノロゞヌ。 24、1565-15672006。

8.ビショップ、CMパタヌン認識および機械孊習Springer、ニュヌペヌク、2006幎。

9. Hertz、JA、Krogh、A。、およびPalmer、R。神経蚈算理論入門Addison-Wesley、Redwood City、1991。

10. Duda、RO、Hart、PEStork、DGパタヌン分類Wiley Interscience、ニュヌペヌク、2000幎。



蚘事の翻蚳Anders Krogh NATURE BIOTECHNOLOGY VOLUME 26 NUMBER 2 FEBRUARY 2008



All Articles