ニューラルネットワークが絵を描く方法

スマートアルゴリズムは、すでに顔を見つけて認識し、画像の主要部分を特定し、さまざまなオブジェクトを認識できます。 また、ニューラルネットワークはさらに進化し、独立して芸術作品を作成することさえできます。



最近、Googleはブログに 、画像を認識するニューラルネットワークを使用する興味深い方法を投稿しました。 出版物のさらなる無料翻訳。



画像





各ニューラルネットワークは、数百万のトレーニング写真でトレーニングされています。 ネットワークには、抽象化のレベルが異なる10〜30のネストされたレイヤーがあります。 まず、画像は入力層に送られ、入力層がその役割を果たし、出力で期待される結果が得られるまで情報を次の層に転送します。



システムの各レベルで何が起こっているかを正確に理解することが重要です。 後続の各レイヤーは、画像の新しい特徴を抽出します。 最初のレベルが写真の角度とエッジを決定し、2番目のレベルが形状を決定し、写真に表示されるものを決定する最後のいくつかのレイヤーであるとします。



認識はその逆です



ニューラルネットワークが画像のペイントを開始するために、ランダムノイズの画像がその入力に供給され、タスクはその中の特定の形状を見つけて誇張することです。 たとえば、バナナを描きます。



画像



これは、ニューラルネットワークがこのイメージまたはそのイメージを認識することを学習したかどうかを理解するために必要です。 たとえば、彼女は特定の特性(2〜4本の歯とハンドル)でフォークを認識するように訓練されました。 この場合、被験者の形と色が決定に影響を与えることはありません。



ネットワークが画像を認識することを本当に学んだかどうかを確認する良い方法は、画像を描画するように依頼することです。



場合によっては、明確な学習エラーを特定できます。 システムは正しいダンベルを描画できませんでした。 ほとんどの場合、トレーニング中に、彼女はダンベルが手だけで完了するのを見ました。



画像



下層


ニューラルネットワークでは、最終結果を指定できますが、指定しません。 入力に画像を送信し、その画像で機能するレベルを指定すると、その能力のすべてが向上します。 エッジを担当する下層で絵を描く例:



画像



高度なレイヤー


解釈のためにより高度なレイヤーを選択した場合、ネットワークは画像内でトレーニングした画像を見つけようとします。



動物の写真で訓練されたニューラルネットワークの入り口で、雲の画像を提出しました。



画像



ネットワークが認識できるすべてのものを、彼女は誇張しました。 このように、雲の中には珍しい動物が形成されました。蝶犬、カタツムリ豚、ラクダ鳥、魚犬です。



画像



同じ手法を他の画像にも適用できます。 結果は、画像の種類によって異なります。 確立されたプロパティは、ネットワークを特定の解釈に傾けます。



たとえば、地平線は塔や塔に、木や岩の輪郭は建物に、葉は鳥や昆虫に変わります。



画像



開発者は、反転描画技術を使用して、特定のレイヤーの認識品質を評価できます。



開発者自身がこの手法を「インセプション主義」(コンセプショニズム)と呼んでいます。 より多くの写真



繰り返し



ニューラルネットワークの入力で、出力からわずかに拡大した画像を送信して、信じられないほどの色空間を得ることができます。 ランダムノイズから開始する場合、出力画像はニューラルネットワークの作成のみと見なすことができます。



画像



この手法は、ニューラルネットワークが分類タスクを実行する方法、アーキテクチャを改善し、学習内容を確認する方法を正確に理解および視覚化するのに役立ちます。



アブストラクト



  1. ニューラルネットワークには、抽象化のレベルが異なる10〜30のネストされたレイヤーがあります。
  2. ニューラルネットワークが画像の描画を開始するには、画像が入力に送られ、タスクはその中の特定のフォームを見つけて誇張することです。
  3. 「コンセプショニズム」技術は、ニューラルネットワークが分類タスクを実行する方法を理解し視覚化するのに役立ちます。



All Articles