猫、犬、機械孊習、深局孊習に぀いお

画像

1997幎、Deep Blueはチェスでカスパロフを砎りたした。

2011幎、ワト゜ンはJeopardyチャンピオンを砎りたした。

あなたのアルゎリズムは2013幎にBobikずFluffyを区別できたすか」




この写真ず序文は、昚幎秋に開催されたKaggle Challengeからのものです。 将来を考えるず、最埌の質問は「はい」ず答えるこずができたす-数十人のリヌダヌがタスクを98.8完了したした。これは驚くほど印象的です。



そしおただ-そのような質問の声明はどこから来たのですか 4歳の子䟛が長い間簡単に解決できる分類タスクが、プログラムにずっお非垞に困難であったそしおただ残っおいるのはなぜですか チェスをするよりも䞖界のオブゞェクトを認識するのが難しいのはなぜですか ディヌプラヌニングずは䜕ですかなぜ猫は恐ろしい䞍倉の圌に぀いおの出版物に登堎したすか それに぀いお話したしょう。



「認識する」ずはどういう意味ですか



2぀のカテゎリず、カテゎリに察応する2぀の山に配眮する必芁がある倚くの倚くの写真があるずしたす。 どのような原則でこれを行いたすか この質問に察する玠晎らしい答えは、誰も確かに知らないずいうこずですが、䞀般的に受け入れられおいるアプロヌチは次のずおりです。カテゎリの1぀でのみ芋぀かる「興味深い」デヌタを写真で調べたす。 これらのデヌタは機胜ず呌ばれ、アプロヌチ自䜓は機胜怜出ず呌ばれたす 。 生物孊的脳が䜕らかの圢で機胜するずいう事実を支持するかなり匷い議論がありたす-最初のこずは、もちろん、猫の再び芖芚皮質の现胞でのヒュヌベルずノィヌれルの有名な実隓です。

甚語に぀いお
機械孊習に関する囜内の文献では、機胜の代わりに「サむン」を曞いおいたすが、私の意芋では、それはなんずなくがやけおいたす。 ここで私は「特城」ず蚀いたす、ロシア語のこのm笑が私に蚱されたすように。




画像のどの郚分を優れた機胜ずしお䜿甚できるかを事前に知るこずはできたせん。 それらの圹割は、むメヌゞ、圢状、サむズ、たたは色の断片など、䜕でもかたいたせん。 フィヌチャは、画像自䜓にも簡単に存圚するこずはできたせんが、゜ヌスデヌタから䜕らかの方法で取埗されたパラメヌタヌで衚珟できたす 。たずえば、 境界フィルタヌを䜿甚した埌などです。 さお、耇雑さが増したいく぀かの䟋を芋おみたしょう。







右折ず巊折を区別できるグヌグルカヌを䜜り、それに応じおハンドルを回したいずしたす。 良い特城を芋぀けるためのルヌルは、ほずんど指で考えるこずができたす。写真の䞊半分を切り取り、特定の色合いアスファルトのセクションを遞択し、巊偎にある皮の察数曲線を適甚したす。 すべおのアスファルトが曲線の䞋に収たる堎合は、右に曲がり、それ以倖の堎合は巊に曲がりたす。 曲率の​​異なる曲がり角の堎合、そしおもちろん、也燥状態ず湿最状態を含むアスファルトの異なる色合いのセットの堎合、いく぀かの曲線を取埗できたす。 確かに、未舗装の道路では、この機胜は圹に立ちたせん。







手曞き数字のデヌタセットMNISTの䟋-この写真は、おそらく機械孊習に少なくずも少し粟通しおいるすべおの人に芋られたす。 各桁には、その桁の皮類を決定する特城的な幟䜕孊的芁玠がありたす-2぀の䞋郚のカヌル、ナニットのフィヌルド党䜓のスラッシュ、8぀の2぀の結合円など。 これらの重芁な芁玠を匷調する䞀連のフィルタヌを䜜成し、これらのフィルタヌを1぀ず぀画像に適甚するず、最良の結果を瀺した人は誰でも正しい答えを埗るこずができたす。

これらのフィルタヌは、たずえば次のようになりたす


Joffrey Hinton の機械孊習コヌスのニュヌラルネットワヌクからの写真

ちなみに、数字の7ず9に泚意しおください-䞋郚にはありたせん。 事実、7ず9で同じであり、認識に圹立぀情報が含たれおいないため、これらの機胜を生成したニュヌラルネットワヌクはこの芁玠を無芖したした。 通垞、そのような特城フィルタヌを取埗するには、通垞の単局ニュヌラルネットワヌクたたは類䌌のものを䜿甚したす。





わかりたした、トピックに近い。 これはどう







これらの2぀の写真には倚くの違いがありたす-目が倧きく広がっおいたす。 明るさ、色、たたは䟋えば、面癜い偶然のレベル-巊の写真では、巊偎が癜い色で、右偎が右偎です。 しかし、私たちは䜕も遞択する必芁がありたせん。぀たり、猫や犬を確実に識別するものです。 ぀たり、たずえば、次の2぀の画像は同じカテゎリに属しおいるず認識される必芁がありたす。







それらを長い間芋お、それらの間で䞀般的なものを理解しようずするず、耳の圢が思い浮かびたす-それらは倚かれ少なかれ同じであり、右に傟いおいたす。 しかし、これも偶然です-猫が間違った方向を向いおいる、頭を傟けおいる、たたは䞀般的に埌ろから撮圱されおいる写真を簡単に想像するこずができたす同じデヌタセットから䟋を芋぀けるこずができたす。 残りはすべお異なりたす。 コヌトのスケヌル、色、長さ、目、姿勢、背景...䞀般的に、共通点はありたせん-それにもかかわらず、頭の䞭の小さなデバむスは、これら2぀の写真を最高の粟床で間違いなく同じカテゎリヌに垰するこずができたす。 。 私はあなたのこずは知りたせんが、時にはそのような匷力なデバむスが私たち䞀人䞀人のすぐ近くにあり、手を貞すだけでも喜んでいたすが、それがどのように機胜するのかただ理解できたせん。



5分間の楜芳論および理論



わかった それでも、玠朎な質問をしようずするず-猫ず犬は芖芚的にどのように違いたすか リストを簡単に開始できたす-サむズ、毛皮、口ひげ、足の圢、撮圱できる特城的なポヌズの存圚...たたは、たずえば、猫には眉毛がありたせん 。 問題は、これらすべおの特城がピクセルの蚀語で衚珟されおいないこずです。 これらの眉毛が䜕であり、どこにあるべきか、たたは足が䜕であり、どこから成長するかを圌に以前に説明するたで、それらをアルゎリズムに入れるこずはできたせん。 さらに、䞀般的に、私たちは猫を持っおいるこずを理解するためにこれらすべおの認識アルゎリズムを実行したす-「口ひげ」、「足」、「尟」の抂念が適甚できる生き物-そしおそれ以前には写真で壁玙や゜ファが終わり猫が始たる堎所を十分に自信を持っお蚀うこずができたす。 円は閉じおいたす。



ただし、ここからはただ結論を導き出すこずができたす。 前の䟋で機胜を定匏化したずき、オブゞェクトの可胜な倉動性から始めたした。 道路の曲がり角は巊たたは右にしかできたせん-他のオプションはありたせんもちろん、たっすぐ進むこずを陀きたすが、䜕もする必芁はありたせん。さらに、道路建蚭の基準により、曲がり角が非垞に滑らかで、盎角ではないこずが保蚌されたす。 したがっお、さたざたな回転曲率、路面の特定のシェヌドのセットを可胜にするように機胜を蚭蚈し、これが可胜な可倉性が終了する堎所です。 次の䟋数字「1」は異なる手曞きで曞くこずができ、すべおのオプションは互いに異なりたすが、必然的にたっすぐな垂盎たたは傟斜線を含む必芁がありたす。そうしないず、1でなくなりたす。 フィヌチャフィルタヌを準備するずき、可倉性のために分類子スペヌスを残したす-スポむラヌの䞋の画像をもう䞀床芋るず、ナニットのフィルタヌのアクティブな郚分は倪いストリップであり、異なる傟斜ず有効な鋭角で線を描くこずができたす䞊郚にありたす。



猫の堎合、オブゞェクトの「操䜜のためのスペヌス」は蚈り知れないほど巚倧になりたす。 写真には、さたざたな品皮の猫がいる可胜性がありたす。あなたが考えるこずができるあらゆる背景に察しお、圌らはいく぀かのオブゞェクトによっお郚分的にブロックされる可胜性があり、もちろん、圌らは10䞇の異なるポヌズを取るこずができたす-そしお、私たちは攟送に぀いおただこれに぀いお蚀及しおいたせん画像内のオブゞェクトを暪に移動する、回転ずスケヌリングは、すべおの分類子の氞遠の頭痛です。 これらすべおの倉曎を考慮に入れるこずができる、前のフィルタヌず同様のフラットフィルタヌを䜜成するこずは䞍可胜な䜜業のように思われたす.1枚の画像で䜕千もの異なる圢状を粟神的に組み合わせようずし、すべおに積極的に応答する圢状のないフィルタヌスポットを取埗したす。 したがっお、必芁な機胜は、䜕らかの耇雑な構造にする必芁がありたす。 どちらがただ明確ではありたせんが、これらすべおの可胜な倉曎を考慮に入れるこずができるはずです。



この「これたでのずころ理解できない」は非垞に長い時間続きたした-機械孊習の歎史のほずんど。 しかし、突然、ある時点で、人々は呚囲の䞖界に぀いおの1぀の魅力的なアむデアを実珟したした。 次のように聞こえたす

すべおのものは、他の、より小さく、より基本的なもので構成されおいたす。



「すべお」ず蚀うずき、文字通り私たちが孊べるこずは䜕でも意味したす。 たず第䞀に、芖芚に関するこの投皿は、写真に瀺されおいるように、もちろん私たちの呚りの䞖界の察象であるためです。 目に芋えるオブゞェクトはすべお、安定した芁玠の構成ずしお衚すこずができ、それらは順番に幟䜕孊的圢状で構成され、それらは特定の順序で配眮された線ず角床の組み合わせです。 このようなもの





䜕らかの理由で私は有益な情報を芋぀けられなかったので、これはアンドリュヌ・りンのディヌプラヌニングに぀いおのスピヌチ コヌスラの創蚭者から切り取られたした



ずころで、玠朎な反射の枠組みでは、私たちの音声ず自然蚀語人工知胜の問題ず長い間考えられおきたは、文字が単語に、単語にフレヌズに、そしおそれらが順番に文に結合される構造的階局であるず蚀えたすテキスト-そしお、新しい単語に䌚うずき、それに含たれるすべおの文字を再孊習する必芁はなく、特別な暗蚘ずトレヌニングを必芁ずするものずしお、なじみのないテキストをたったく認識したせん。 歎史に目を向けるず、次のような考えを衚明するさたざたなアプロヌチを芋぀けるこずができたす。



1. 1959幎の実隓ですでに蚀及したフヌベルずノィヌれルは、画面䞊の特定の蚘号に反応する脳の芖芚皮質の现胞を発芋したした。さらに、圌らは他の现胞の存圚を発芋したした。最初のレベルのセルからの信号。 これに基づいお、圌らは同様の怜出噚セルの階局党䜓の存圚を瀺唆したした。

実隓のビデオからの矎しい抜粋
...ここで、圌らがほずんど偶然にニュヌロンを反応させる必芁な特城を発芋したこずが瀺されおいたす-ガラスの瞁がカメラに萜ちるように通垞のサンプルより少し遠くに移動するこずによっお。 敏感な人には、動物のm笑に泚意しおください。



2.機械孊習の専門家の2千分の1の領域のどこかで、 ディヌプラヌニングずいう甚語は、1぀のニュヌロン局ではなく倚数のニュヌロンネットワヌクを参照しおいるため、いく぀かのレベルの機胜を孊習できたす。 そのようなアヌキテクチャには、厳密に正圓化された利点がありたす。ネットワヌクのレベルが高いほど、より耇雑な機胜を衚珟できたす。 そのようなネットワヌクをトレヌニングする方法にはすぐに問題がありたす-以前に広く䜿甚されおいた逆䌝播アルゎリズムは、倚数のレむダヌではうたく機胜したせん。 これらの目的のためのいく぀かの異なるモデルがありたす-自動゚ンコヌダヌ、限定されたボルツマンマシンなど。

3.ゞェフ・ホヌキンスは、2004幎の「知性に぀いお」の本で、階局的アプロヌチが掚進し、未来は圌にあるず曞いおいたす。 圌はすでにボヌルの開始に少し遅れおいたしたが、私はそれを蚀及せざるを埗たせん-このアむデアは完党に日垞的なものず単玔な蚀語に由来し、機械孊習から十分に遠い人であり、䞀般的にこれらすべおのニュヌラルネットワヌクが悪いず蚀いたしたアむデア。 本を読んで、それは非垞に刺激的です。



コヌドに぀いお少し



したがっお、仮説がありたす。 1024x768のピアピクセルを孊習アルゎリズムに詰め蟌んで、メモリ䞍足ず認識に重芁なピクセルを理解できないためにゆっくりずチョヌクを芋るのではなく、さたざたなレベルで構成される画像から階局構造を抜出したす。 最初のレベルでは、写真の最も基本的で構造的に単玔な芁玠のいく぀かを芋る぀もりです-その建物のレンガ境界、ストロヌク、セグメント。 より高い-最初のレベルのフィヌチャ角床などの安定した組み合わせ、さらに高い-前のものから配眮されたフィヌチャ幟䜕孊的圢状など。 実際には、問題は-別の写真のそのような構造をどこで取埗するかです。



コヌドを抜象的な質問ずしお少し話したしょう。



コンピュヌタヌで珟実䞖界のオブゞェクトを衚珟する堎合、いく぀かのルヌルセットを䜿甚しお、このオブゞェクトを1぀ず぀デゞタル圢匏に倉換したす。 たずえば、文字はバむトマッピングASCIIに入れられ、画像は倚くの小さなピクセルに分割され、それぞれが明るさず色の情報を䌝える䞀連の数字で衚されたす。 色を衚珟するためのモデルは倚数ありたすが、䞀般的には、トレヌニングに䜿甚するものは重芁ではありたせんが、簡単にするために、1ピクセルが0から1たでの数字で衚珟され、その明るさを黒から癜たで衚珟する癜黒の䞖界を想像したす







このビュヌの䜕が問題になっおいたすか ここの各ピクセルは独立しおおり、最終画像に関する情報のごく䞀郚のみを送信したす。 これは、䞀方で、画像をどこかに保存したり、ネットワヌク経由で転送したりする必芁があるずきに、スペヌスを取りたせんので、快適で有益です。䞀方で、認識には䞍䟿です。 この䟋では、画像の䞋郚に斜めのストロヌク少し曲がったがありたす。ここから掚枬するのは難しいですが、これは顔写真からの錻の茪郭の詳现です。 したがっお、この堎合、このストロヌクを構成するピクセルは私たちにずっお重芁であり、黒ず癜の境界は重芁です-そしお、正方圢の䞊郚にあるラむトグレヌの色合いでほずんど知芚できない光の遊びは完党に重芁ではなく、それにコンピュヌティングリ゜ヌスを費やすこずもできたせん。 ただし、このビュヌでは、すべおのピクセルを䞀床に凊理する必芁がありたす。各ピクセルは他のピクセルよりも優れおいたす。

ここで別のコヌドを想像しおみたしょう。 この正方圢を他の同じ正方圢の線圢和に分解し、それぞれに係数を掛けたす。 透明床の異なる暗いガラスのプレヌトをどのように取り、各プレヌトにさたざたなストロヌク垂盎、氎平、異なるが描画されるか想像できたす。 これらのプレヌトを重ねお配眮し、透明床を調敎しお写真に䌌たものを䜜成したす。完璧ではありたせんが、認識には十分です。







私たちの新しいコヌドは機胜的な芁玠で構成されおいたす-それぞれが、元の正方圢に別の意味のあるコンポヌネントの存圚に぀いお䜕かを蚀うようになりたした。 垂盎ストロヌクのコンポヌネントの係数は0.01です。たた、サンプルには「垂盎性」がほずんどないこずがわかりたすただし、「斜めストロヌク」がたくさんありたす-最初の係数を参照。 この新しいコヌドのコンポヌネントであるディクショナリを個別に遞択した堎合、れロ以倖の係数はほずんどないず予想できたす。このようなコヌドはsparseず呌ばれたす 。

このような衚珟の有甚なプロパティは、 ノむズ陀去オヌト゚ンコヌダヌず呌ばれるアプリケヌションの䟋で芋るこずができたす。 画像を取埗し、たずえば10x10の小さな正方圢に分割し、各ピヌスに察応するコヌドを遞択するず、この画像をランダムなノむズず歪みから印象的な効率で消去し、ノむズの倚い画像をコヌドに倉換しお元に戻すこずができたすたずえば、たずえば、 こちらをご芧ください 。 これは、コヌドがランダムノむズの圱響を受けないこずを瀺し、オブゞェクトを認識するために必芁な画像の郚分を保存したす。これにより、埩元埌のノむズが「少なく」なったず考えられたす。



このアプロヌチの反察は、新しいコヌドが重いこずです。コンポヌネントの数によっおは、以前の10x10ピクセルの正方圢が重くなる可胜性がありたす。 スケヌルを評䟡するには、人間の脳の芖芚皮質が玄100,000個のニュヌロンを䜿甚しお14x14ピクセル寞法196を゚ンコヌドしおいるずいう蚌拠がありたす。



そしお、階局の最初のレベルを突然取埗したした。これは、このコヌドの語圙芁玠のみで構成されおいたす。これは、今ご芧のように、ストロヌクず境界線です。 この蟞曞をどこかから持っおくるこずは残っおいたす。



5分間の緎習



SciPyPythonの機械孊習甚ラむブラリであるscikit-learnパッケヌゞを䜿甚したす。 具䜓的には、MiniBatchDictionaryLearningのクラスサプラむズです。 ミニバッチ-アルゎリズムは䞀床にデヌタセット党䜓ではなく、亀互に小さいランダムに遞択されたデヌタパケットで実行されるためです。 プロセスは簡単で、10行のコヌドが必芁です。



from sklearn.decomposition import MiniBatchDictionaryLearning from sklearn.feature_extraction.image import extract_patches_2d from sklearn import preprocessing from scipy.misc import lena lena = lena() / 256.0 #   data = extract_patches_2d(lena, (10, 10), max_patches=1000) #    10x10 -   data = preprocessing.scale(data.reshape(data.shape[0], -1)) # rescaling -    ,      1 learning = MiniBatchDictionaryLearning(n_components=49) features = learning.fit(data).components_
      
      







フィヌチャにあるものを描画するず、次のようなものが埗られたす。

pylabを介した出力
 import pylab as pl for i, feature in enumerate(features): pl.subplot(7, 7, i + 1) pl.imshow(feature.reshape(10, 10), cmap=pl.cm.gray_r, interpolation='nearest') pl.xticks(()) pl.yticks(()) pl.show()
      
      











ここでしばらく停止し、最初からこれを行った理由を思い出しおください。 描かれたオブゞェクトを構成する、かなり独立した「ビルディングレンガ」のセットを取埗したかったのです。 これを実珟するために、倚数の小さな正方圢の断片を切り取り、アルゎリズムを介しおそれらを駆動し、これらすべおの正方圢の断片を、そのようなコンポヌネントの構成の圢で認識できる十分な確実性で衚珟できるこずを発芋したした。 10x10ピクセルのレベルではもちろん、画像の解像床に䟝存したすが゚ッゞず境界にしか遭遇しないため、結果ずしおそれらを取埗したす。

この゚ンコヌドされた衚珟を怜出噚ずしお䜿甚できたす。 ランダムに遞択された画像が゚ッゞであるかボヌダヌであるかを理解するために、scikitに次のように同等のコヌドを取埗するよう䟝頌したす。



 patch = lena[0:10, 0:10] code = learning.transform(patch)
      
      







コヌドのコンポヌネントのいずれかが他のコンポヌネントに比べお十分に倧きい係数を持っおいる堎合、これは察応する垂盎、氎平たたは他のストロヌクの存圚を瀺しおいるこずがわかりたす。 すべおのコンポヌネントがほが同じである堎合、それは写真のこの堎所に単玔な背景たたはノむズがあるこずを意味したす。



しかし、私たちは先に進みたいです。 これには、さらにいく぀かの倉換が必芁になりたす。

したがっお、サむズ10x10の任意のフラグメントは、49個の数字のシヌケンスで衚珟できたす。各数字は、䞊の図の察応するコンポヌネントの透明床係数を意味したす。 次に、これらの49個の数字を7x7の正方行列の圢匏で蚘述し、䜕が起こったかを描きたす。

そしお、次のこずがわかりたした明確にするために2぀の䟋を瀺したす。







巊偎は元の画像の断片です。 右偎ぱンコヌドされた衚珟です。各ピクセルは、コヌド内の察応するコンポヌネントの存圚レベルです明るいほど匷い。 最初のフラグメント䞊には明確なストロヌクがなく、そのコヌドは淡い灰色の淡い匷床の行のすべおの混合物のように芋え、2番目のコンポヌネントには明確に存圚し、残りはすべおれロです。



次に、階局の2番目のレベルをトレヌニングするために、元の画像から倧きなフラグメントを取り出しいく぀かの小さなもの、たずえば30x30、それに収たるようにし、小さなフラグメントに切り取り、゚ンコヌドされたバヌゞョンでそれぞれを提瀺したす。 次に、䞀緒にドッキングし、そのようなデヌタに基づいお別のDictionaryLearningをトレヌニングしたす。 ロゞックは単玔です-最初のアむデアが正しければ、隣接する゚ッゞず境界線も安定した繰り返しの組み合わせにたずめる必芁がありたす。







䟋の結果ずしお刀明したこずは、䞀芋しお意味のあるものに芋えたせんが、䞀芋しただけです。 ここでは、たずえば、人間の顔で蚓緎された階局の第2レベルで䜕が起こるか。



䜕ずか写真が倚すぎる


ただし、ここでは、フラグメントサむズをさらに遞択したす-10x10ではなく25x25。 このアプロヌチの䞍快な機胜の1぀は、「最小セマンティックナニット」のサむズをカスタマむズする必芁があるこずです。





2番目のレベルは最初のレベルのコヌドでトレヌニングされるため、結果の「蟞曞」を描くためにいく぀かの困難が発生し、そのコンポヌネントは䞊の図のドットが厩れたように芋えたす。 これを行うには、別のステップを螏む必芁がありたす-これらのコンポヌネントを再び分割し、最初のレベルを䜿甚しお「デコヌド」したすが、ここではこのプロセスを詳现に怜蚎したせん。



そしお、たったく同じ原則に埓っお、必芁になるたでレベルが䞊がりたす。 ここで、たずえば、3番目です。 そしお、ここで私たちはすでに面癜いものを芋おいたす





ここの各面は、160x160サむズの機胜です。 最も䞀般的な堎所はいく぀かありたす-正面、巊右に半回転、さたざたな肌の色。 同時に、各機胜にはさらに2぀のレむダヌがあり、最初にテストむメヌゞの有効性をすばやく確認できるようにし、2番目に远加の自由床を䞎えたす-茪郭ず境界線は理想的な線から倖れるこずがありたすが、これたでのずころ圌らのレベルの特城、圌らは圌らの存圚を2階に知らせる機䌚がありたす。

悪くない。



そしお、䜕-すべお、私たちは勝ちたしたか



明らかにそうではありたせん。 実際、猫ず犬に関する目的のデヌタセットにこれらのすべおのセットを描画するのず同じスクリプトを実行するず、画像は非垞に憂鬱になりたす-レベルごずに、わずかに湟曲した境界線を描くほが同じ機胜を返したす。

わかりたした、これは間違いなく最埌です


1匹の犬の顔を埋めるこずが刀明したしたが、これは玔粋なチャンスです-サンプルで同様のシル゚ットが、たずえば2回芋぀かったからです。 スクリプトを再床実行するず、衚瀺されない堎合がありたす。





埓来のフィヌドフォワヌドニュヌラルネットワヌクを批刀したのず同じ理由で、私たちのアプロヌチは苊劎しおいたす。 孊習プロセスにおける蟞曞孊習は、いく぀かの共通の堎所、画像の遞択されたフラグメントの構造コンポヌネントを探したす。 顔の堎合、すべおがほが類䌌しおいるため、すべおがうたくいきたした-䞀定の数の逞脱を䌎う现長い楕円圢および階局のいく぀かのレベルは、この点でより倚くの自由を䞎えたす。 猫の堎合、デヌタセット党䜓で2぀の類䌌したシル゚ットを芋぀けるこずは難しいため、機胜しなくなりたした。 アルゎリズムは、テストセット内の画像間で共通点を怜出したせん-ストロヌクず境界線をただ凊理しおいる最初のレベルを陀きたす。 倱敗。 再び行き止たり。 䜿いたした。



未来ぞのアむデア



実際、考えおみるず、倚数の異なるアザラシのサンプルは、さたざたな品皮、姿勢、サむズ、色をカバヌするずいう点で優れおいたすが、私たちの知性さえ蚓緎するのにはあたり成功しないかもしれたせん。 最終的に、オブゞェクトの可胜性のあるすべおのバリ゚ヌションをすばやく調べるのではなく、オブゞェクトの繰り返しず芳察を繰り返す方法によっお倚くを孊びたす。 ピアノの匟き方を孊ぶためには、絶えず音階を匟く必芁がありたす。そしお、このために千の叀兞的な䜜品を聎くだけで十分であればいいず思いたす。 したがっお、アむデアは、サンプルの倚様性から逃れ、同じシヌン内の、たずえば異なる䜍眮にある1぀のオブゞェクトに集䞭する回数です。



2番目のアむデアは最初から続いおおり、Jeff Hawkinsが蚀及したものを含め、倚くの人々から既に発蚀されおいたす。 最埌に、1぀のオブゞェクトで時間内に芳察するさたざたな圢ず姿勢を確認したす-そしお、最初に、少しず぀新しい猫を衚瀺するように、同じ猫を衚瀺するず信じお、順番に到着する写真をグルヌプ化できたすポヌズ。 ぀たり、少なくずも、トレヌニングセットを根本的に倉曎し、「kitty wakes up」ずいうリク゚ストで芋぀かったYouTubeビデオを甚意する必芁がありたす。 しかし、それに぀いおは次のシリヌズで詳しく説明したす。



コヌドを芋おください



... githubでできたす。 python train.py myimage.jpgを実行したす写真でフォルダヌを指定するこずもできたす、さらに远加の蚭定-レベルの数、フラグメントのサむズなど。 scipy、scikit-learn、matplotlibが必芁です。



圹立぀リンクず、ディヌプラヌニングに関するその他の情報








All Articles