検索エンジンのランキングアルゴリズムの識別

心の糧



SEOの分野でしばらく仕事をしていると、遅かれ早かれ、検索エンジンが検索結果にサイトを表示するために使用する数式の高低を考えることになります。 誰もがこれがすべて極秘に保たれていることを知っており、私たちオプティマイザーは、ウェブマスター向けの推奨事項とウェブサイトプロモーション専用のリソースに書かれていることだけを知っています。 ここで少し考えてみましょう:80-95%の精度で信頼性が高く、サイトのページで、またはサイト全体で正確に実行する必要があることを特定の要求に対して示すツールを持っている場合あなたのサイトはSERPの最初の位置、5番目、または単に最初のページにありました。 それだけでなく、このツールが特定のアクションを実行した場合に到達する位置を同じ精度で決定できる場合。 また、検索エンジンがその式に変更を導入し、1つまたは別の要因の重要性を変更するとすぐに、式で正確に変更された内容をすぐに確認できます。 そして、これはそのようなツールから得られる情報のほんの一部です。



したがって、これは次のプロモーションサービスの広告ではなく、検索エンジンによるサイトのランキングのための特定の公式の提供でもありません。 私の理論を共有したいのですが、その実装には、手段も時間も、プログラミングと数学の十分な知識もありません。 しかし、このすべてを持っている人でさえ、これを実装するのに1ヶ月、おそらく1〜1。5年もかからないかもしれないことは確かです。



理論



したがって、理論は、空に指を突くことにより、どの因子が他の因子よりも多かれ少なかれ位置に影響するかを見つけることにあります。 指ですべてを伝えるのは非常に難しいので、伝えたいことを多かれ少なかれ表示するテーブルを作成する必要がありました。



画像



テーブルを見ましたか? ここまでがポイントです。 重要な語句はどれでもかまいません。どの語句でもかまいません。検索エンジンに入力し、検索結果から最初の10サイトを取得します。これらは実験的なものです。 次に、次のことを行う必要があります。プログラムが検索エンジンの結果と完全に一致するようにサイトを配置するまで、ランキングファクター(表のPF )の重要度をランダムに変更するコードを記述します。 つまり、入力して検索エンジンのランキングアルゴリズムを繰り返す必要があります。 ポジティブなニュートラルまたはネガティブとしてのみ定義できる要因自体の重要性。



次に、表と要因について順番に説明します。 通常、1〜800(およそ)の値を各因子に割り当てます。 たとえば、Yandexにはこの数値に近いランキングファクターがあることが確実にわかっているためです。 大まかに言えば、私たちの最大数は私たちが確かに知っているのと同じくらい多くのランキング要因になります。 2つの要因に同じ番号を付けることはできません。つまり、各要因には一意の値があります。 表の各因子には個別の列があり、それらは多数あります。物理的にすべてを1つの画像に配置することはできません。



質問は、ページランクの計算方法ですか? 非常に簡単:まず、単純な数学で、因子がプラスの効果を持っている場合、因子のランクをページランクに追加し、マイナスの場合、0を追加します。 、たとえば、キーフレーズの大量スパム。



ページランクを計算するためのこのアルゴリズムのようなものを取得します。 ( PR )でそれを取り、係数を( F )として取り、それから:



PR =最初の因子を取るF1が正の場合、PR + F1を行い、F1が負の場合、PR-F1を行い、F1がニュートラルの場合、何もせず、因子までF2、F3、F4などをチェックします。使い果たします。

選択は、各因子がランクの各値を試すように行う必要があります。 つまり、各値のすべての要因を試すことです。



全体の難しさは、ページ上のテキストの量および実験ページへのリンクが配置されているサイトのTICまで、すべての影響要因を考慮することであり、この難しさはこの情報を考慮することではなく、収集することですらあります。 このすべての情報を手動で収集するのは非現実的であるため、プログラムがすべてのデータを自動的に収集するように、あらゆる種類のパーサーを作成する必要があります。



作業は非常に大規模で複雑であり、ある程度の知識が必要ですが、実装後にどのような機会が開かれるかを想像してください。 計算の複雑さや要因の影響については詳しく説明しません。多くの落書きが好きではありません。人に直接説明する方が簡単です。



今では、さまざまなバリエーションに多くの偶然の一致があると言う人もいます。 はい、できますが、最初のページではなく、たとえば最初の50ページを取得する場合はどうでしょうか。 スリップの可能性は何回減りますか?



まだいくつかの要因を取る場所がないという難しさがあります。たとえば、行動要因を考慮することができません。 SERPのすべてのサイトが私たちの制御下にあるとしても、ユーザーがSERPでどのように振る舞うかを正確に考慮している可能性が高いため、これを行うことはできません。ここから、位置自体に加えて、方程式の2番目の未知数が表示されます。



そのようなソフトウェアは実装後に何を提供しますか? いいえ、彼は正確な検索エンジン式を提供しませんが、どの要素がランキングにより強く影響し、どれが重要ではないかを明確に示します。 昇格するとき、サイトのページをこの式のパラメーターに置き換えることができます。昇格を開始する前でも、検索エンジンがすべての変更を考慮した後、特定のリクエストでページがどの位置にあるかがわかります。



一般に、これは非常に複雑なトピックであり、心にとって非常に有用な情報です。たとえば、そのような計算には1台のコンピューターのパワーで十分だと思うからです。 それで十分な場合、たとえば、どれくらい時間がかかりますか? 結果が満たされない場合、100ページの結果で100%の正確な結果が得られるまで、数式は何らかの形で複雑になり、変更される可能性があります。 さらに、実験を純粋にするために、約100の異なるサイトを接続し、それらに存在しないキーフレーズを実装し、同じキーフレーズを使用してアルゴリズムを追跡できます。 多くのオプション。 働く必要があります。



All Articles