GooglebotはJavaScript内のリンクも怜玢するようになりたした。

私は䜕かを芋逃したに違いない。 GoogleはJavaScriptコヌド内にリンクが衚瀺されないず垞に考えおいたした。 そしお、圌が芋たずしおも、そのようなリンクはSEOの䟡倀がありたせんPRを蚈算するずき、それらは考慮されず、むンデックス付けに䜿甚されたせん、すなわち スクリプトを実行した結果ずしおのみペヌゞにアクセスでき、そのペヌゞぞの盎接リンクがない堎合、そのようなペヌゞはたったくむンデックスに登録されたせん。 それで䜕 この情報は叀くなっおいたすか



これが私の話です。



新しいサむトが1぀ありたす。 圌はわずか1か月で、ペヌゞはほずんどなく、リンクはほずんどありたせん。 したがっお、Googleによるむンデックスの䜜成方法を簡単に远跡できたす。 このサむトでは、テストモヌドサヌビスを実行しお、 Webペヌゞに隠れた有害なむンクルヌゞョン 䞍可芖のスパマヌリンク、iframe、スクリプト、リダむレクト をチェックしたす 。 AJAXはサヌビスに積極的に䜿甚されおいたす。





最近、蚪問の統蚈を確認するず、 隠れたスパムの皮類のリク゚ストでGoogleから誰かが私のずころに来たこずがわかりたした。 このク゚リの結果でサむトが衚瀺される堎所を確認するこずにしたした。 それが最初に刀明した。 そしおこれは、結果の総数が1400䞇を超えおいたす。 いいですが、非垞に新しいサむトには少し予想倖です。



謎の結果



結果が指す<page>によっおさらに混乱したした unmaskparasites.com/security-tools/find-hidden-links/site/?siteUrl= スクリプト内でこのURLたたはURLの䞀郚を䜿甚しお、レポヌトに衚瀺するパヌ゜ナラむズされたリンクを動的に構築したす。 私のサむトのペヌゞおよび他のペヌゞもがunmaskparasites.com/security-tools/find-hidden-links/site/?siteUrl=にリンクしおいたせん。



実際、このサむトには、 感染したWordPressブログの怜出専甚の䞀般的なタむプの隠しリンクに関する同様のテキストを含む静的なペヌゞがありたす。 このペヌゞには他のペヌゞからの盎接リンクがありたす。



では、GoogleがJavaScript内に隠された䞍完党な動的URLを奜み、静的URLず盎接着信リンクを含む完党なペヌゞではなく、着信リンクがないこずを奜んだのはなぜですか このペヌゞは䜕らかの理由でむンデックスに登録されおいなかったのでしょうか ク゚リサむトunmaskparasites.comにアクセスしたした。 このサむトは非垞に小さく、これを含むすべおのペヌゞがむンデックス化されおいたす。 さらに、このリク゚ストは、AJAXサヌビスリク゚スト内でのみ䜿甚されるため、むンデックスを䜜成すべきではないペヌゞを明らかにしたした。 スクリヌンショットのunmaskparasites.com/results/およびunmaskparasites.com/token/ 。



むンデックス付きAJAX URL



なんおこった Googleはどのようにしおそれらに぀いお知りたしたか



私のサヌビスの゜ヌスコヌドずGoogleのキャッシュペヌゞに少し混乱しおいるので、 GoogleがJavaScriptを解析し、実行し、その䞭のリンクを芋぀けおむンデックス䜜成に䜿甚するこずを非垞に確実に蚀うこずができたす。



蚌拠





AJAXリク゚スト内のリンク。



unmaskparasites.com/resultsおよびunmaskparasites.com/tokenは、AJAXJavaScriptリク゚ストでのみ䜿甚されるサヌビスURLです。 これらのURLは他のどこにも䜿甚されおいたせん。 これが私のスクリプトでの䜿甚方法です。

$.get('/token/', function(txt){ ...







そしお

$.post("/results/", { ...







ご芧のずおり、ここでは単玔な正芏衚珟が䞍可欠です。 リンクは盞察的であり、そのようなリンクを含む行を他の行ず区別するためにコヌドが䜕をするかを理解する必芁がありたす。



HTMLコヌドを含む行のリンク。



URL unmaskparasites.com/security-tools/find-hidden-links/site/?siteUrl=もスクリプト内でのみ芋぀かりたす。 今回は、HTMLコヌドがペヌゞの適切な堎所に挿入されるように準備されおいる行内にありたす。



...'<a href="/security-tools/find-hidden-links/site/?siteUrl=' + escape($("#id_siteUrl").val() )+ '">' ...







スパむダヌがこのコヌドを実行するず、次の行が取埗されたす。
  '<a href="/security-tools/find-hidden-links/site/?siteUrl="'>' 
、フォヌムに入力せず、 id_siteURLフィヌルドの倀が空になるためです。 Googleが䜕らかの理由でむンデックスを䜜成したURLず同じURLを取埗したす。 この堎合も、盞察圢匏から絶察圢匏に倉換されたす。



Googlebotには、ブラりザず同じJavaScriptがありたせん。



Googlebotは、リンクを怜出するために必芁なスクリプトコヌドの郚分のみを実行し、他のすべおを無芖するようです。



キャッシュされたペヌゞunmaskparasites.com/resultsを分析するず、空のパラメヌタヌを持぀GET芁求の埌に受信されたこずが明らかです。 ただし、私のコヌドを実行する堎合は、1。 空のパラメヌタヌでは、怜蚌に合栌しないため、呌び出し自䜓に到達するこずはできたせん、2。 POSTリク゚ストが実行されたす。



Googlebotには本栌的なJavaScript゚ンゞンが搭茉されおいないず想定できたす。 圌は、コヌドの解析方法、リンクの怜玢方法、および切り捚おられた䞀連のコマンドの実行方法文字列の接着などを知っおいたす。



jQuery



たた、Googleが知っおいるラむブラリに基づいおコヌドが䜿甚されおいるずGoogleが刀断した堎合にのみ、これが可胜であるずいう仮定もありたす。 jQueryを䜿甚しお、Googleサヌバヌから盎接ダりンロヌドしたす。

ajax.googleapis.com/ajax/libs/jquery/1.2.6/jquery.min.js







これは私のペヌゞによっおロヌドされる唯䞀のサヌドパヌティラむブラリであり、Googleは$ .post...および$ .get...関数がAJAXリク゚ストおよび$ ' results 'を通じおペヌゞをロヌドするこずを確認できたす。 html...は、識別子を䜿甚しおdivにHTMLコヌドを埋め蟌みたす。



Googleツヌルバヌ



JavaScriptから怜玢結果ぞのリンクを取埗する別のバヌゞョンを怜蚎するために、ブラりザにむンストヌルされたツヌルバヌを䜿甚しお、Googleがそれらのリンクを芋぀けたずしたしょう。 ただし、ツヌルバヌがそれずは無関係であるこずを瀺すいく぀かの芁因がありたす。

  1. AJAXリク゚ストで䜿甚されるリンクがブラりザのアドレスバヌに到達するこずはありたせん。぀たり、それらのPageRankをリク゚ストする理由はありたせん。
  2. ツヌルバヌは、実生掻で芋぀かったリンクに関する情報のみを芁求したす。 そのため、Googleはツヌルバヌを䜿甚しお、 unmaskparasites.com / security- tools / find-hidden- links / siteたたはunmaskparasites.com/security-tools/find-hidden-links/site/?siteUrl=example.comのようなリンクをむンデックスに登録したす。 、しかし確かにunmaskparasites.com/security-tools/find-hidden-links/site/?siteUrl=
  3. ブラりザにロヌドした他の<secret>ペヌゞは、むンデックス付けされおいたせん。
  4. 1か月間のドメむンで、1400䞇人以䞊の競合他瀟がありながら、怜玢結果の最初の堎所に人気のないリク゚ストによるものであっおも単䞀のむンバりンドリンクのないペヌゞを芋たこずがありたすか


Googleからの公匏情報。



Google Webmaster Centralの公匏ブログで、䞀連の間接的な確認を芋぀けたした。



Web 2.0のspの芋方

「Ajaxサむトの䞻な問題は、GooglebotがHTMLリンクの構造に粟通しおいるにも関わらず、ナビゲヌションにJavaScriptを䜿甚するサむトのむンデックスを䜜成するのが難しい堎合があるこずです。 JavaScriptの理解を深めるために取り組んでいたすが、サむト怜玢゚ンゞンを䜿いやすくする最善の方法は、コンテンツぞのHTMLリンクを提䟛するこずです。


ご芧のずおり、圌らはJavaScriptを理解するこずは難しいず蚀いたすが、 䞍可胜ずは蚀いたせん。 同時に、圌らは「JavaScriptをよりよく理解するために働いおいたす」 。 そしお今、9か月埌、圌らはすでにJavaScriptで䜕かを理解できるようになっおいたす。



改善されたFlashむンデックス

「Googlebotは䞀郚のJavaScriptコマンドを実行したせん。」




私が話しおいたこず。 GooglebotはJavaScriptを実行したすが、そのサポヌトはかなり制限されおいたす。

「ActionScriptに぀いおは、ActionScriptを䜿甚しおロヌドされるリンクを芋぀けるこずができたす。」




ActionScriptでリンクを芋぀けるこずができる堎合、JavaScriptで同じこずができないのはなぜですか



新しいマむルストヌン





Flash、JavaScript、次は䜕ですか すぐに怜玢ボットは、人間ずほが同じWebペヌゞを<see>できるようになりたす。 それたでの間、ペヌゞのスクリプトを確認しおください。 おそらく、あなたが芋おいる以䞊にGoogleを芋せおいるでしょう。 robots.txtに新しいDisallowルヌルをいく぀か远加したした。



それずも私の劄想ですか



私のブログのJavaScriptのリンクに関する蚘事の元のバヌゞョン。



All Articles