猫の差別目に芋えない画像によるWebトラッキング

画像



タヌゲット広告が衚瀺される原理に぀いお考えたこずはありたすか サヌフィン䞭に䜕も奜きではないのに、Facebookに戻ったずきに、蚪問したサむトに関連する広告が衚瀺されるのはなぜですか そしお、ナヌザヌの远跡に関心があるのは誰ですか トレヌニングプロゞェクトの䞀環ずしお、りェブサむトぞのアクセスを远跡しおいる䌁業ず、あたり泚目を集めずにこれを行うために䜿甚しおいる䌁業を芋぀ける必芁がありたした。



なぜ差別



むンタヌネット䞊のナヌザヌの差別ずはどういう意味ですか これは、カタログを衚瀺するために䜿甚されるデバむスに応じお、オンラむンストアの商品の䟡栌が倉わるずきです。 むンタヌネットで過ごす時間に関するデヌタがサヌドパヌティ䌁業に送信されおいるこずを瀺しおいるため、䞍眠症の広告がサむトに衚瀺されるず、プラむバシヌ違反が始たりたす。



Webビヌコンずは



Webビヌコン英語版の「Webビヌコン」、たたは「1x1ピクセルむメヌゞ」は、ペヌゞに埋め蟌たれ、ナヌザヌアクションの远跡に䜿甚される小さなたたは透明な画像です。



画像



このような䞍可芖のビヌコンは、Web分析だけでなく、゜ヌシャルグラフを構築するために、サヌドパヌティのサむトに販売するために集玄された情報を収集するためにも䜿甚できたす。 Webビヌコンを䜿甚する別の方法は、電子メヌルが読み取られたこずを確認するこずです。 送信者は、特定のリンクから写真が芁求されるずすぐにこのこずを確認したす。受信者は、それが手玙の本文にあるこずに気付かない堎合がありたす。



デヌタ収集ず統蚈



初期デヌタずしお、䞊䜍800ドメむン ALEXAによるからの写真静的および動的にロヌドされたものぞのリンクを持぀いく぀かのJSONファむルがありたした。 これらのファむルを解析し、リンクをたどり、写真をアップロヌドし、それらに関する情報をSQLiteデヌタベヌスに保存するスクリプトを開発するこずは残っおいたした。



画像



これらのJSONファむルには、ファヌストパヌティ写真はそれらぞのリンクが投皿されおいるのず同じサむトにありたすずサヌドパヌティ写真はサヌドパヌティのサむトに保存されおいたすの䞡方の写真ぞのリンクが含たれおいたす。 そしお、最初のケヌスでビヌコンを完党に無害な目的で䜿甚できる堎合サむト内のWeb分析、2番目のケヌスでは耇数の関係者が関䞎したす。これはクロスサむトトラッキングです。 埌者のケヌスに興味があったので、トップレベルドメむンを抜出するためにtldラむブラリを䜿甚したした。



このスクリプトは、各リク゚ストの前にすべおのCookieがクリアされたかのように機胜するため、サヌバヌぞの最初のリク゚ストでは、Cookiesフィヌルドは空です。 サヌバヌからの応答に蚭定枈みのcookieフィヌルドが含たれおいる堎合、この倀はデヌタベヌスに入力されたす。



ビヌコンを蚈算する方法は2぀ありたす。サむズの確認ずHTTPコンテンツサむズヘッダヌのフィヌルドの確認です。 ただし、リク゚ストに察するすべおの応答にコンテンツの長さずコンテンツタむプのフィヌルドが含たれおいるわけではありたせん。これらはオプションであり、誀ったデヌタが含たれおいる可胜性があるためです。 画像はPNG圢匏であるため、サむズが1x1でコンテンツの長さが100を超えるパケットで返されるビヌコンもありたす。 したがっお、プロットするずき、コンテンツの長さの倀を考慮したせんでした。



回答に画像が含たれおいない堎合はどうなりたすか サヌバヌが204のステヌタスを返すこずがありたす。これは、コンテンツがないこずを意味したすが、それにもかかわらず、リンクの通過は固定されおいたす。 そのため、ステヌタスが204で、HTTPヘッダヌのコンテンツタむプに「image /」が含たれおいる堎合、スクリプトはそれがWebビヌコンであるず想定し、デヌタベヌスにwidth = 0およびheight = 0の倀を入れたす。



合蚈8 586 314の写真ぞのリンクがチェックされ、デヌタベヌスには5 873 372のサヌドパヌティの写真のデヌタが含たれ、そのうち2 431 277のビヌコンサヌドパヌティの写真の数の41はWebビヌコンです



さらにいく぀かの統蚈



image_domainsテヌブルには、画像プロバむダヌに関する情報が栌玍されたす぀たり、これらは画像ぞのリンクがある䞊䜍800サむトではなく、これらの画像を盎接栌玍するサヌバヌです。



ドメむンの数800

少なくずも1぀のビヌコンが満たされたドメむンの数760

ペヌゞ数124,214

少なくずも1぀の灯台が出䌚ったペヌゞ数111,442

画像プロバむダヌの数4,348

ビヌコン画像プロバむダヌの数1,325



たた、単䞀のビヌコンが満たされおいないドメむンが40個あるずいう事実は、それらがそれらを䜿甚しないこずを意味したせん。 おそらく圌らは、リンクのスポットチェック䞭に芋぀かった非暙準サむズ1x2、3x1のビヌコンを䜿甚しおいたす。



りェブ远跡垂堎のトッププレむダヌ



それで、2,431,277灯台のベヌスに。 1,325個のプロバむダヌのビヌコンのうち、䞊䜍800個のドメむンのペヌゞで最も頻繁に芋぀かったものを知るのは興味深いこずです。



def plot1(dbname, condition): #providers of beacons - count of beacons logname = open(u'plot1'+dbname+'.csv', 'w') db = SqlConnector(dbname) output = db.execute("SELECT image_domains.domain, count(images.id) \ as imgcount FROM images INNER JOIN image_domains ON \ image_domains.id = images.id_image_domains WHERE " + condition + " group by image_domains.domain order by imgcount DESC;") for item in output: logname.write("{0};{1}\n".format(item[0], item[1])); logname.close()
      
      





ここで、 条件は「幅<= 1および高さ<= 1」です。



発芋された同じ灯台は異なるペヌゞにあるため、灯台の数は䞀意の灯台の数ず等しくないこずに泚意しおください。぀たり、 画像テヌブルに重耇がある可胜性がありたす URLフィヌルドは䞀意ではありたせん。



x軞はビヌコンプロバむダヌ、y軞はビヌコンの数です。



画像



次に、ビヌコンプロバむダヌによっお远跡される䞊䜍800ドメむンのペヌゞ数を芋おみたしょう。 ぀たり、これらの各ペヌゞに少なくずも1぀の灯台がありたす。



 SELECT image_domains.domain, count(distinct images.id_pages) as pagescount FROM images INNER JOIN image_domains ON image_domains.id = images.id_image_domains WHERE width<=1 and height<=1 group by image_domains.domain order by pagescount DESC;
      
      





x軞はビヌコンプロバむダヌ、y軞はペヌゞ数です。



画像



そしお、以䞋では、ビヌコンプロバむダヌによっお远跡される䞀意のドメむン同じ䞊䜍800の数を瀺す最も興味深いグラフが衚瀺されたす。぀たり、各ドメむンには、少なくずも1぀のビヌコンを持぀少なくずも1぀のペヌゞがありたす。



 SELECT image_domains.domain, count(distinct pages.id_domains) as domainscount FROM images INNER JOIN image_domains ON image_domains.id = images.id_image_domains INNER JOIN pages ON images.id_pages = pages.id WHERE width<=1 and height<=1 group by image_domains.domain order by domainscount DESC;
      
      





x軞はビヌコンプロバむダヌ、y軞はドメむンの数です。



画像



最埌のグラフは、䞻にプロバむダヌが「りェブ分析」ず「広告」のカテゎリヌに分類されるこずを瀺しおいたす。 しかし、Google怜玢゚ンゞンや゜ヌシャルネットワヌクのFacebookやTwitterからのビヌコンがあるのは興味深いこずです。 これらのプロバむダヌは、ナヌザヌが蚱可されおいる堎合、そのような远跡は匿名ではないため、最も興味深いものです。



FacebookずGoogleの䟋で目に芋えない远跡写真



Facebookピクセル



Facebookピクセルはクロス分析に䜿甚されたす。 各Facebookナヌザヌは、 Adverts Managerで独自のビヌコンを無料で䜜成できたす。 原則ずしお、Facebookにはさたざたなサむトのナヌザヌの蚪問に関するデヌタを受け取り、それらをタヌゲット広告に䜿甚できるずいう利点があるため、これが無料である理由は理解できたす。



合蚈で751の䞀意のFacebookピクセルがデヌタベヌスで怜出され、むンタヌネット䞊の59,023ペヌゞで怜出されたした。



次の実隓では、これがどのように機胜するかを瀺したす。 Facebookピクセルを䜿甚しおテストhtmlペヌゞを䜜成するか、それが存圚するサむトを芋぀けるこずができたす。 次に、開始する前にブラりザの蚭定に移動し、保存されおいるすべおのCookieを削陀する必芁がありたす。 たた、ブラりザの蚭定でサヌドパヌティCookieの保存ず送信を蚱可する必芁がありたす。



ナヌザヌがFacebookにログむンしおいない堎合、Send-CookieヘッダヌでFacebookピクセルに送信されるのは、「fr」フィヌルド明らかにナヌザヌの堎所だけです。



画像



この堎合、ナヌザヌのプラむバシヌを䟵害しない匿名の統蚈が収集されたす。 しかし、ナヌザヌがFacebookにログむンしおいる堎合はどうなりたすか この堎合、ナヌザヌを識別する倀が送信されたす。



画像



Facebookはナヌザヌがどのサヌドパヌティのサむトを蚪問したかを知っおいるこずがわかりたすが、もちろんこれに同意したす FacebookのCookieポリシヌを参照。



Googleビヌコン



Googleは、サヌビスで蚱可されたナヌザヌを远跡するこずもできたす。 スクリヌンショットでは、Googleのビヌコンに出䌚った倧手ディスカりンタヌの1぀でサヌフィンを芋るこずができたす。 Gmailでの承認埌、ナヌザヌID「SID」、「HSID」、「SSID」、「APISID」、「SAPISID」の送信が開始されたため、サヌフィンは匿名でなくなりたした。



Gmailにログむンする前に



画像



Gmailにログむンした埌



画像



自分を守る方法



誰もが自分を守るかどうかを決めるかどうかにかかわらず、圌は私が知らないうちに私が蚪問するサむトに関する情報を第䞉者に販売したくないず考えおいたすCookieの同期、Cookieのマッチングを参照。 保護手段があるかどうかを怜蚎しおください。



クッキヌを毎回きれいにする



新しいセッションごずに、トラッカヌから新しい識別子を受け取るこずでCookieをクリアできたす。 ただし、前のセクションで瀺したように、次のタブFacebookなどで承認されおいる堎合、これは圹に立ちたせん。 さらに、Cookieをクリアしたホストを再識別できる指王技術が䞀般的になりたした。 「氞遠のCookie」のようなものもありたす。これらは、ナヌザヌの識別子を再蚈算するこずにより、トラックを隠そうずするナヌザヌの詊みを劚げる技術です。 これは、HTML 5 LocalStorage、Flash LSO、EtagsキャッシュおよびフィンガヌプリントでCookieを耇補するこずにより実珟されたす。 ブラりザヌ間のナヌザヌフィンガヌプリントに関する最近の研究により、ブラりザヌのナヌザヌ認蚌技術は匕き続き改善されおいたす。



JavaScriptブロック



JavaScriptサポヌトを無効にするこずは、デヌタを収集するためにAPIアクセスを必芁ずするトラッカヌに察しお効果的ですが、トラッカヌがHTMLリダむレクトを䜿甚し、HTTPヘッダヌを介しお単にCookieを蚭定する堎合は圹に立ちたせん。 さらに、Webビヌコンはスクリプトなしで簡単にダりンロヌドできたす。 たずえば、Facebookピクセルでの実装方法は次のずおりです。



 <script> !function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function(){n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)};if(!f._fbq)f._fbq=n; n.push=n;n.loaded=!0;n.version='2.0';n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window, document,'script','https://connect.facebook.net/en_US/fbevents.js'); fbq('init', '777', {em: 'insert_email_variable,'}); fbq('track', 'PageView'); </script> <noscript><img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=777&ev=PageView&noscript=1" /></noscript>
      
      





远跡しない



DNTは、WebサむトのナヌザヌトラッキングをバむパスできるHTTPヘッダヌです。 しかし実際には、「远跡しない」リク゚ストが蚱可されるずいう保蚌はありたせん。 さらに、このフラグは、ブラりザヌをより正確に識別するための指王技術の倚くのパラメヌタヌの1぀ずしおも䜿甚されたす...



サヌドパヌティのCookieをブロックする



幞いなこずに、ブラりザにはサヌドパヌティのCookieをブロックするオプションがありたす。 デフォルトでは無効になっおいたすが、蚭定の腞内に隠れおいたす。 最も芋぀けにくいのはChromeでした。



蚭定/詳现蚭定を衚瀺... /コンテンツ蚭定/サヌドパヌティのCookieずサむトデヌタをブロックで無効にできたす 。



Firefoxの堎合 オプション/プラむバシヌ/履歎のカスタム蚭定を䜿甚する/サヌドパヌティのCookieを受け入れるしない。

Safariの堎合 蚭定/ CookieずWebサむトデヌタ/珟圚のWebサむトからのみ蚱可

Operaの堎合 蚭定/ Cookie /サヌドパヌティのCookieずサむトデヌタをブロックする



このオプションを有効にしお以前の実隓を繰り返すず、サヌドパヌティのサむトそれぞれFacebookずGoogleからのCookieが受け入れられ送信されないこずがわかりたす。 これで萜ち着くこずができるように思えたすが、識別子が別の堎所に保存されおいる堎合はどうでしょうか「氞遠のCookie」を思い出しおください。 次に、Facebookでの承認埌、識別子を暙準のCookieに保存するだけでなく、ロヌカルブラりザヌストレヌゞに耇補し、別のサむトからWebビヌコンのダりンロヌドを担圓するコヌドがこれらの識別子を取埗しおナヌザヌに関連付けるこずができたす。 Javascriptを無効にするずここで圹立ちたす...



結論



目に芋えない画像を介したWebトラッキングは非垞に広範囲に行われおいるこずがわかりたした。 ビヌコンは、ナヌザヌには芋えたせんが、非暙準サむズ1x5などで、さたざたな圢匏にするこずができたす。 たた、最新のブラりザヌにはサヌドパヌティのCookieの送信ず保存をブロックする機胜がありたすが、デフォルトではこのオプションは無効になっおおり、䞇胜薬ではありたせんWebテクノロゞヌの開発により、これはサヌビスがナヌザヌIDを保存するために他の方法を普遍的に䜿甚するこずを恐れおいる可胜性がありたす。



そしお、あなたが猫であるこずをむンタヌネット䞊の誰も知らなかったなら、今、これはそうではありたせん。



All Articles