視覚モデリング。 パート6 アイトラッキングのモデリング

1アイツアー -2知覚 -3視覚のジオメトリ -4アイトラッキング -5視線の捉え方 -6アイトラッキングのモデリング



第六部、最終。 ストーリーは、アイトラッキングモデリングの原理と、これを実際の生活にどのように適用できるかについて直接説明しています。 最後に、このパートでは、 3番目4番目5番目の投稿で強調された数値と原則が役立ちます。



どの視線追跡モデルに関心がありますか?



第4部で説明したように、画像の領域を見るのに費やされた時間と、人間の意識によってその領域に払われる注意の程度との間には直接的な関係があります。 少なくとも、人が自分が見ているものをまだ理解していない場合、彼は間違いなくそれを覚えているでしょう!



したがって、モデリングのタイプの1つは、表示期間のヒートマップ、または長時間の研究の可能性がある画像の領域に関する情報を作成することです。



別の興味深いタイプのモデルはサッカードダイナミクスです。人が現在の視線を注視している場合、視線がどの時点で急ぐかを示す図です。 この種の図を分析することにより、表示中の画像のどの部分が最も重要に見えるかを理解できます。 ダイナミクスダイアグラムとヒートマップを組み合わせることで、どの側面の詳細が人の視線を最も重要だと思うものからそらすことができるかを理解できます。







モデリングの適用性の限界





心理的に中立な画像のみがサッカードモデリングに適しています 。感情的に色付けされた絵画は、注目の中心を大きくシフトします。 たとえば、泣いている子供を見るとき、人の外見は必然的に、側面の輪郭よりも表情の研究により注意を払うでしょう。



同じ要因は、人の外見が非常に個人的であることを意味します。特定の人がハトに無関心でなければ、ハトで写真を見るとき、彼は間違いなく鳥に無関心な人とは違って視線を動かします。



小さいながらも認識可能な輪郭(人の顔、テキストの文字など)が写真に(心理的には中立であっても)存在すると、モデリング前にこれらの輪郭の画像を予備認識する問題が生じます。 このマニュアルを作成する機会となったプログラムでは、まったく認識されていませんが、輪郭を知覚する複雑さの評価しかありません。 しかし、結論は、パターン認識品質により、モデルの実際の視線追跡で得られたデータへのコンプライアンスが大幅に向上し、不在は致命的なミスマッチにつながる可能性があるということです。



モデリングは、目的もなく、タスクもなく、写真レビューの状況に適しています。 特定の目的で画像を表示する場合、パターン認識の役割が増加し、輪郭の知覚力に影響します。



これはどこに適用できますか?





モデルの適用可能性の限界に慣れるとき、論理的な疑問が生じます:「そのような限界があれば、実際の生活に適用できるのはどこですか?」



また、 これは主にテキスト分析に関連する幅広いタスクに適用できます 。 ご存知のように、テキストの認識は、その書式設定、段落、単語と記号の間の空のスペースの量、フォントスタイルなどに強く影響されます。



テキストは、最初は処理前に、サッカードモデリング手法による分析に理想的な心理的に中立な画像と見なされます。 同じヒートマップは、どの単語、段落、および他のテキストユニットが最も記憶しやすいかを示します。テキストの書式設定により注意が払われるためです。 一方、同じフォーマットのために、どのブロックのテキストが識別不能ゾーンに落ちて焦点が外れているかを理解できます。







テキストの知覚を分析することに加えて、モデルは最適な知覚領域(何かを表示する-広告ユニット)または非知覚(何かを隠す-連絡先電話番号;)を見つけるためにうまく機能します。



まあ、ユーザビリティテストの目的で迅速な画像分析のためにタスクのクラスを完全に除外する必要はありません。 「大人の」視線追跡システムとフォーカスグループのトップ10人へのアクセスは、しばしば不可能です。



仕組み





サッケードベクトルのモデリングを最も単純なレベル(つまり、私にとってはどのように機能するか)にするには、2つの問題を解決する必要があります。



  1. 指定された領域の特定の「知覚力」の計算。
  2. スポットライトの「重量」に関する情報に基づいて、アイトラップを見つけて強調表示します。


最初のタスクに対する古典的なソリューションは、次の一連のアクションを使用して実行されます。



  1. 目の光学的知覚の角度に応じた、必要な領域の選択。
  2. 人間の視力のパラメータに応じた選択領域の正規化(したがって、ガウスぼかしはここでは完全には適用できません)。
  3. 周波数分析と知覚のしきい値を使用した輪郭の分離(この段階では、輪郭自体が重要ではなく、輪郭に近いためGaborフィルターが適しています)。
  4. Glassアルゴリズムによる輪郭の連続性の違反の検出と連続性の違反点の正規化(主観的な回路のベクトルを見つけて、それらを目的の回路で補完するため);
  5. 方向の変化量、等高線ベクトルの方向の広がり、およびブレークポイントの数に基づくゾーンウェイトの計算。




実際、ゾーンの重みはその中の輪郭の複雑さの単なる推定値であり、輪郭の複雑さはベクトルとブレークポイントの方向の散布からの一種の合成です。 2番目のタスクでは、正確な数字ではなく、相対的な重みが必要です。 したがって、輪郭の複雑さの関数の代わりに、その導関数を使用できます。 また、導関数は、その場合、放射状座標のセグメントのエッジの座標の構成に比例します。 したがって、輪郭の複雑さを決定する問題は、多数の放射状コードとの輪郭の交点の数を見つけることまで減らすことができます。



経験上、小さな半径の半径(96dpiの場合、急性視力のゾーンの半径は約18ピクセルになり、周辺視力を考慮した調査対象の領域-57)、許容可能な重量の計算には、20度のステップで9つの放射状コードで十分です。 角度ステップを減らすと、重みの順序を決定する精度が向上しますが、重みを計算する古典的なモデルによって得られた結果と比較するとわずかに異なります。



同じ経験から、dpiが異なるため、視覚ゾーンの半径も異なるため、領域を30ピクセルの半径の円にするという形で、領域を事前に正規化して同じ18線モデルを使用するのが理にかなっています。



何のために、どんな場合でも計算の精度が向上しても、より良い結果にならないのですか? そして、輪郭操作自体に一定の誤差があり、18線モデルの計算誤差は、方法自体の誤差に比べて比較的小さいという事実によります。



2番目のタスク-注視のトラップを識別するタスクは、次の方法で解決できます。



  1. 最大重量のゾーンを選択して、画像の領域全体をスキャンする
  2. 見つかったポイントからグラフを作成し、それらの間の接続の重みを確立します
  3. グラフ上の標準問題を解く


2番目の問題を解決するとき、アイトラップを構成するポイントの各ペアまたはトライアドは、特定の重みを比較します。これは、隣接するトラップに対するポイントの構成の相対的な強さです。 この重みの意味は、見つかったトラップの注視を固定する期間です。 別のアプローチは、ポイント間の接続の重みを確立する弾性グラフ法です。



見つかった情報からダイアグラムを生成する問題については触れません;)



1アイツアー -2知覚 -3視覚のジオメトリ -4アイトラッキング -5視線の捉え方 -6アイトラッキングのモデリング



All Articles