検索エンジンアルゴリズムの進化

画像



検索エンジンにとって、検索結果のサイトの優先順位付けの問題は常に最も重要な問題でした。 この問題により、次の2つの問題が発生します。



1.クエリに最も正確に一致するサイトを判断する方法(関連性)。

2.ユーザーが検索エンジンで探しているものを見つけられない場合、ユーザーは別の検索エンジンを使用することを好みます。



ランキングアルゴリズムは、オンライン資産を正しく評価するためにも非常に重要です。これは、かつてDotcomバブルの形成につながった要因の1つでしたが、実際にはインターネットリソースは実際に売買される通常のリソースである可能性があります。 最後に、「サイトの重み」を理解しなければ、オンライン広告業界は発展できなかったでしょう。 これらの場合、評価メカニズムが関与し、他のリソースと比較してサイトの成功、関連性および品質のパラメーターの評価のための信頼できる基準を決定する必要に直面しています。



したがって、収集されたデータに基づいて特定のパラメータをサイトに割り当てるという問題は、検索エンジンとデジタルワーカーの両方にとって最も重要なタスクです。







既存の会計方法




インターネットリソースのランク付けと評価のタスクは解決でき、数学的に解決され、大量の統計データを収集して処理する分野に関連しています。 次のいずれかです。







基準重量ランキング





会社の創設者の1人であるラリーペイジにちなんで名付けられたGoogleのランキングアルゴリズムは、最初の1つであり、実際、1996年の作成時の徹底的な関連性により、巨大な会社の設立につながりました。



このメカニズムは、同様のメカニズムと同様に、「参照質量」または「参照グラフ」などの概念で動作します。 最も単純な形式では、次のように聞こえます。他のリソースがリソースを参照するほど、このリソースはより重要になります。 したがって、上位にランクされます。 より細かい調整を目的としたアルゴリズムのさらなる複雑さは、リソースに重みを割り当て、それに応じて文字通りおよび比sense的な意味で「価格」をその上にあるリンクに割り当てることにより、スパムリソースからリンクを除外するように設計されています。



ユーザー行動ランキング





検索エンジンは、すべての保証にもかかわらず、明らかにリファレンスマスによるランク付けを拒否しませんが、ランキングアルゴリズムは徐々に複雑になり、リンクの数と「価格」に基づく要素は、特別なグループに割り当てられた約200のほかにランク付けに既に使用されていますサイトのユーザー行動データとそれらの間のリンクに基づく要因。



データソース


データは以下を介して収集されます。

1.ブラウザーのアドオン(Alexa)

2.メトリック(Yandex.Metrica、Google Analytics)

3.専用ブラウザ(Chrome、Yandex.Browser)



これらのデータは、サイトのランキング、価格設定、サイトに掲載された広告資料、および関連出版物に使用されます。



各検索エンジンが独自のブラウザーを作成し、より速く、より便利に、多くの追加の機能を備えたものとして送信したいという願望は、データを収集する目的でユーザーを引き寄せようとする試みにすぎません。 そのため、多くのユーザーが代替検索エンジンに切り替えています。たとえば、ユーザーに関する情報を収集しません-作成者によると、DuckDuckGo などです。




ユーザーの行動、特にリンクのクリックに関するデータに基づいてランキングアルゴリズムを作成する最初の試みの1つは、2008年にSIGIRで公開されたBrowseRankでした。



1つまたは別のアルゴリズムによるランキングの違いは明らかです。



画像



出所



結論





検索アルゴリズムに関しては、非開示などの問題に直面しています。検索エンジンの従業員を除いて、それがどのように確実に機能するかは誰にもわかりません。 したがって、新しい「成功した有用なランキング方法」がいわゆる「ブラック」プロモーション方法によって非常に迅速にスパム送信されたことが判明したとき、「困難なミスの息子の経験」が考慮されました。 現在、彼らはアルゴリズムをSEOスペシャリストに対して不透明にしようとしているため、「ハッキング」、「不正行為」、および適切なサイトインフラストラクチャ、合理的なコンテンツの作成、消費者のニーズを満たすなどの「ホワイトファクター」以外の方法による影響を受けないようにしています。 リンクの存在に関するやや「たるみ」のランキング要素は、ユーザーの行動とリンクのクリックに基づく要素によって補完されます。これらの要素は、外部の影響による影響がはるかに少なく、その結果、信頼性が高くなります。



トピックの詳細:

ユーザーの行動の分析と検索結果のパーソナライズ。 ヤンデックス研究。

BrowseRank-概要。

BrowseRankの履歴

BrowseRankプレゼンテーション(元の英語テキスト)




All Articles