ロボット除外プロファイル

多くの場合、インデックスを作成する価値のあるページには、インデックス作成を目的としない情報が含まれています。



画像



これは、ハブの「here and there」クエリの4番目の結果です



また、これは各ページで繰り返されるナビゲーションにのみ適用されるとは思わないでください。 おそらく、他のサイト、広告、および非常に動的なコンテンツからのニュースフィードをインデックスに登録することを望んでいる人はほとんどいないでしょう(「これらはサイトにあります...」)。 誰かがコメントのインデックス作成を無効にし、誰かが自分の投稿のコンテンツを検索エンジンに隠し、見出しのみを残したいと考えています。



原則として、セマンティックWebにはこのような問題はありません。 しかし、私たち一人一人は、それらの明るい時代に生きないチャンスを持っています。



解決策は、 ロボット除外プロファイルmicroformatという長い間存在していました。



外観は次のとおりです。

< head profile =” http: // example . org / xmdp / robots-profile #” >

...

< div class =” robots-noindex> There once was a man from Nantucket… </ div >

< p > This page is not about < span class =” robots-noindex> pornography </ span > . </ p >



* This source code was highlighted with Source Code Highlighter .








私の知る限り、この形式は最終的に受け入れられず、検索エンジンによってサポートされていないということを知っている限り、この話は1つだけ隠れています。



Google Developer DayまたはYandex Subbotniksにアクセスした人は、少なくともドラフトを検索エンジンのアルゴリズムに含めるかどうかを開発者に尋ねます。 :)



PSインデックスからページの一部を除外することがすでに可能であれば、それについて教えてください。



UPD: <noindex>について知っています。 しかし、それは標準に違反しており、Googleには認識されていません。



All Articles