目が写真をどのように知覚するかについて

目がどのように写真を読むのだろうか? 写真をよく見ると、画像の一部が目を引き付けて、自分を引き裂き、他の詳細に集中することが不可能になるのを感じるのはなぜですか? 60年代の心理学者と生理学者のグループによるこの質問に答える試みとして、視覚の理論が作成されました。 理論が開発されました:現時点では、写真を読む瞳の動きをシミュレートし、この動きを画像の特定の部分への注意の集中に関連付けることができる少なくとも3つの数学装置があります。



2、3年前、私は画像を見るときの注意のモデリングに密接に取り組み、先日、そのようなプログラムの仕事を見せるように頼まれました。 私は生のアーカイブの後ろのほこりだらけのコーナーに登り、開梱し、コンパイルを開始し、アルゴリズムのいくつかのバグを修正することに決めました...そして夢中になりました! 2日間の努力の成果を紹介します。いくつかの写真と、人が写真をどのように知覚するかをモデル化する2つの異なる方法です。



写真は三連祭壇画の形式で表示されます。 最初の部分は元の画像です。 中央の部分はヒートマップです。 緑の輝きが強いほど、この地域が注目を集める可能性が高くなります。 最後の図は、視界のダイナミクスです。 このモデルは、視線が画像上をどのようにすり抜けるかを示しています。 視線は明るい部分から暗い部分へ、またはその逆に移動しやすくなります。注意の焦点を暗い部分から明るい部分に移すには、おそらく多少の努力が必要です。



写真を見るとき、人の注意を集中させるモデリングを提供する数学的装置は、知覚などの心理的側面を考慮していないことを理解する必要があります。 写真は、写真内の認識可能な画像検出しない場合 、人間の目がどのように動くかを示しています。





最初の写真は、「フレームの中央にあるオブジェクト」などの典型的な写真がどのように知覚されるかを示しています。 視線がどのように中心まで上昇するが、そこに到達しないかは特に興味深い。 視界は、いわば、物体が光のタッチで刻まれている中心領域を愛sします。 ダイナミクスのある画像では、すべての構成要素が二次的な注意の焦点と上向きの吸引のベクトルの形で完全に見えます。





しかし、通常の風景。 写真の下から見ると、木の幹の方を向いており、木から上または下を見ると、空の真ん中に目が不意に落ちる「潜在的な穴」がはっきりと見えることに注意してください。





Webページについて少し。 ページのどの部分が注目を集めていると思いますか? 表示する最も重要なことは何ですか? もちろん、広告!





作曲に対する主張のある風景。 そして、すぐにこの構図がどのように散らばっているのかを見ることができます-これらの人々をわずか1スクエアだけ右にシフトすると、黄金のセクションが維持されていました! そのため、注意は写真の端と人々のシルエットに集中します。





しかし、この写真は、知覚の心理的側面のために自動分析がどのように遅れ始めるかを示すためだけに示します。 写真を見るとき、人々は顔を区別し、無意識に顔に注意を向けます。 この場合、車は異様な獣の顔として認識されます。 この写真の視線追跡があれば、最大の注意がクライスラーの「額」と人の顔にあることに気づいたでしょう。 ところで、これは次の写真にも当てはまります。





「すべて」のモナリザ。 全体として考えると、顔が目を引き付け、写真がどのように知覚されるかを忘れてください。 ここではヒートマップは何も提供しませんが、ダイナミクスは興味深いものを示しています! 顔の右側に、鼻を指す正方形があり、辺は黄金比に比例していることがわかります。 さらに、目を覆っている四角形のポリゴンをよく見ると、それらの辺がほぼ調和シリーズに対応していることがわかります(不整合はアルゴリズムの誤差に完全に適合します)! 幾何学におけるレオナルドのこの知識の後にとてもうらやましい...





さて、私の好きな印象派に移りましょう。 ヒートマップは、アルゴリズムが遅れているか、画像が複雑すぎて認識できないことをすぐに示します。 それが多くの人がゴッホをそんなに熱心に思う理由なのでしょうか? ほぼ白色のノイズのグリッドを作成する無関係なスポットライトの束...この背景に対して、鍋が思慮深い表示に向かない限り、詳細に花を捕まえることはとても困難です。 しかし、すべてがダイナミクスの視覚化を変えます! ストロークの詳細から気をそらし、遠くから絵を知覚すると、テーブル上のエントリポイントと花の形で爆発的な完成を備えた明確な斜めの軸を見ることができます! 写真は静的ではなく、写真が生き続けます!




All Articles