1幎間のコンピュヌタヌビゞョンの開発結果

パヌト1 分類/䜍眮特定、オブゞェクト怜出、オブゞェクト远跡



このスニペットは、コンピュヌタヌビゞョン研究チヌムによる最近の出版物から匕甚されおいたす。 今埌数か月で、この驚くべき技術ずその珟状に぀いおさらに孊びたい人に教育リ゜ヌスを提䟛するために、人工知胜の分野のさたざたな研究トピックに関する䜜品を、その経枈的、技術的、瀟䌚的応甚に぀いお公開したす。 私たちのプロゞェクトは、すべおの研究者に最先端のAI開発に関する情報を提䟛する成長する仕事に貢献したいず考えおいたす。


はじめに



通垞、コンピュヌタヌビゞョンは科孊的分野ず呌ばれ、マシンに芖芚的たたはよりカラフルな胜力を䞎え、マシンが呚囲の環境やむンセンティブを芖芚的に分析できるようにしたす。 このプロセスには通垞、1぀以䞊の画像たたはビデオの評䟡が含たれたす。 British Machine Vision AssociationBMVA は、コンピュヌタヌビゞョンを「画像たたはそのシヌケンスから有甚な情報を自動的に抜出、分析、および理解する」ず 定矩 しおいたす 。



理解ずいう甚語は、芖芚の機械的定矩の背景に察しお興味深いこずに際立っおおり、コンピュヌタヌビゞョンの分野の重芁性ず耇雑さの䞡方を瀺しおいたす。 私たちの呚囲の真の理解は、芖芚的衚珟を通しお達成されるだけではありたせん。 実際、芖芚信号は芖神経を通過しお䞀次芖芚野に入り、高床に定型化された感芚で脳によっお解釈されたす。 この感芚情報の解釈は、私たちの自然な組み蟌みプログラムず䞻芳的経隓のほがすべおのセット、぀たり、進化がどのように生き残るようにプログラムしたか、そしお私たちが生涯を通じお䞖界に぀いお孊んだこずをカバヌしたす。



この点で、 ビゞョンずは解釈のための画像の送信のみを指したす。 たた、 コンピュヌティングは、画像が思考や意識に䌌おいるこずを瀺し、脳の倚くの胜力に䟝存しおいたす。 したがっお、倚くの人は、コンピュヌタヌ環境、぀たり芖芚環境ずそのコンテキストの真の理解が、クロスドメむン領域での完璧な習熟のおかげで、匷力な人工知胜の将来のバリ゚ヌションに道を開くず信じおいたす。



しかし、この驚くべき領域の開発の初期段階を実質的に残しおいないので、歊噚を぀かたないでください。 この蚘事では、2016幎のコンピュヌタヌビゞョンの最も重芁な成果に぀いお簡単に説明したす。 そしお、これらの成果のいく぀かを、予想される短期の瀟䌚的盞互䜜甚ず、該圓する堎合、私たちが知っおいるように人生の終わりの仮説的予枬の匷固な混合物に圓おはめるこずを詊みるこずができたす。



私たちの仕事は垞に可胜な限り最もアクセスしやすい方法で曞かれおいたすが、この特定の蚘事のセクションは議論の䞻題のために少しあいたいに芋えるかもしれたせん。 私たちはどこでも原始的なレベルで定矩を提䟛しおいたすが、それらは重芁な抂念の衚面的な理解のみを提䟛したす。 2016幎の䜜品に焊点を圓お、簡朔にするために省略しおいるこずがよくありたす。



これらの明らかな省略の1぀は、コンピュヌタヌビゞョンの分野で広く䜿甚されおいる畳み蟌みニュヌラルネットワヌクCNNの機胜に関連しおいたす。 ImageNetコンテストで競合他瀟を驚かせた2012幎のAlexNetの成功、CNNアヌキテクチャは、この分野で事実䞊起こった革呜の蚌拠でした。 その埌、倚数の研究者がCNNベヌスのシステムの䜿甚を開始し、畳み蟌みニュヌラルネットワヌクがコンピュヌタヌビゞョンの䌝統的な技術になりたした。



4幎以䞊が経過し、コンピュヌタヌビゞョン甚の新しいニュヌラルネットワヌクアヌキテクチャの倧郚分はCNNバリアントによっお構成されおいたす。 研究者は、それらをデザむナヌキュヌブのように䜜り盎したす。 これは、オヌプン゜ヌスの科孊出版物ずディヌプラヌニングの䞡方の力の真の蚌拠です。 ただし、畳み蟌みニュヌラルネットワヌクの説明はいく぀かの蚘事に簡単に拡匵されるため、䞻題をより深く理解し、耇雑なものを明確な蚀語で説明したい人に任せたほうがよいでしょう。



この蚘事を続ける前にトピックをすばやく理解したい䞀般の読者には、以䞋の最初の2぀の情報源をお勧めしたす。 䞻題をさらに深く掘り䞋げたい堎合は、他の゜ヌスを提䟛したす。





ニュヌラルネットワヌクずディヌプラヌニング党般をより完党に理解するには、以䞋をお勧めしたす。





䞀般に、この蚘事は断片的でけいれん的であり、著者の賞賛ずそれがどのように䜿甚されるべきかの粟神をセクションごずに反映しおいたす。 情報は、私たち自身の発芋的手法ず刀断に埓っお郚分に分割されたす。これは、このような倚数の科孊論文のクロスドメむンの圱響による必芁な劥協です。



読者が情報の䞀般化から利益を埗お、以前の荷物に関係なく知識を向䞊させるこずを願っおいたす。



すべおの参加者を代衚しお、

Mタンク







分類/ロヌカリれヌション



画像に関する分類タスクは、通垞、画像党䜓にラベルを付けるこずですたずえば、「猫」。 これを念頭に眮いお、ロヌカラむズずは、この画像内のオブゞェクトの堎所を特定するこずを意味したす。 通垞、オブゞェクトの呚囲の特定の境界ボックスで瀺されたす。 ImageNetの珟圚の分類方法は 、オブゞェクト分類の粟床においお、 特別に蚓緎された人々のグルヌプより もすでに優れおいたす。



図 1 コンピュヌタヌビゞョンタスク



出兞 フェむフェむ、アンドレむカルパシヌゞャスティンゞョン゜ン2016cs231n、レクチャヌ8-スラむド8、空間的䜍眮確認ず怜出2016幎1月2日、 pdf



ただし、クラスの数が増えるず、近い将来の進捗を枬定するための新しいメトリックが提䟛される可胜性がありたす。 特に、Kerasの䜜成者であるFrançoisScholletは、人気のあるXceptionアヌキテクチャなどの新しいメ゜ッドを 、17,000クラスを含む耇数のラベルを持぀3億5,000䞇枚以䞊の画像を含むGoogleの内郚デヌタセットに適甚したした。



図 2 ILSVRCコンテスト2010〜2016幎の分類/ロヌカリれヌション結果





泚 ImageNet倧芏暡芖芚認識チャレンゞILSVRC。 2011-2012以降の改善は、AlexNetの登堎によるものです。 分類ずロヌカリれヌションの競合芁件の抂芁をご芧ください。

出兞 Jia Deng2016。 ILSVRC2016オブゞェクトのロヌカラむズ玹介、結果。 スラむド2、 pdf



ImageNet LSVRC2016の興味深い抜粋





物䜓怜出



ご想像のずおり、オブゞェクトを怜出するプロセスは、本来行うべきこずを正確に実行したす。画像内のオブゞェクトを怜出したす。 ILSVRC 2016オブゞェクト怜出定矩には、個々のオブゞェクトの境界ボックスずラベルの発行が含たれたす。 これは、分類ずロヌカリれヌションが1぀の支配的なオブゞェクトではなく、倚くのオブゞェクトに適甚されるため、分類/ロヌカリれヌションタスクずは異なりたす。



図 3 顔が唯䞀のクラスであるオブゞェクトの怜出



泚 写真は、同じクラスのオブゞェクトの怜出ずしおの顔怜出の䟋です。 著者は、この分野で絶え間ない問​​題の1぀を小さな物䜓の怜出ず呌んでいたす。 テストクラスずしお小さな顔を䜿甚しお、圌らはサむズ、画像解像床、およびコンテキストの正圓化における䞍倉性の圹割を調査したした。

出兞  Hu、Ramanan2016、p。1



2016幎のオブゞェクト怜出の分野における䞻な傟向の1぀は、より高速で効率的な怜出システムぞの移行でした。 これは、YOLO、SSD、R-FCNなどのアプロヌチで、むメヌゞ党䜓の共同コンピュヌティングぞのステップずしお芋るこずができたす。 これは、Fast / Faster R-CNNテクニックに関連するリ゜ヌス集玄型サブネットずは異なりたす。 この手法は、䞀般的に゚ンドツヌ゚ンドのトレヌニング/孊習ず呌ばれたす。



本質的に、アむデアは互いに独立した各サブ問題の個別のアルゎリズムの䜿甚を避けるこずです。これは通垞、トレヌニング時間を増加させ、ニュヌラルネットワヌクの粟床を䜎䞋させるためです。 このようなニュヌラルネットワヌクの最初から最埌たで機胜する適応は、通垞、最初のサブネットが機胜した埌に発生するため、遡及的な最適化を衚すず蚀われおいたす。 ただし、高速/高速R-CNN技術は䟝然ずしお非垞に効率的であり、オブゞェクト怜出に広く䜿甚されおいたす。






All Articles