PageRankの要約の問題

権威のある誰かがあなたを参照する場合、それは多くの無許可のソースからのリンク(「音声」)よりもあなたのステータスを上げます-それはGoogleサイトをランク付けする最初のアイデアでした。 彼女は、ソーシャルネットワーク分析の明らかな継続を発見しました。ここでは、PageRankは一種の中心性です。 ソーシャルグラフのどのノードがより「中心的」で、どの基準に基づいているかを判断します。 私はこの分野の専門家ではありません。 斜めの大まかな調査から、インターネット上のソーシャルネットワーク分析は、主に人々のランキングが主要な目標ではないソーシャルメディアマーケティングのニーズに主に使用されているように思えました。 むしろ、smmの目標は、ブランドをより効果的に宣伝したり、売り上げを伸ばしたりすることです。しかし、人をランキングすることは、独立した興味深い目標になり得ます。 ここにこれらの関心事を簡単にリストしました。



PageRank式を直接ランク付けして適用すると、疑問が生じます。 私はそれらに答えるのに十分な能力を持っていません。知識豊富なコミュニティの反応を期待しています。



1.サイトの従来のPageRankには確率的な解釈があります。これは、人がこのサイトへのリンクをランダムにクリックする確率です。 これには、減衰係数、つまり ユーザーが無限にクリックしないという事実。 数学的な観点から見ると、減衰係数はランキング問題の解決策の一意性を保証します。 しかし、人々をランク付けすることになると、確率的解釈はその意味を失います。 その場合、減衰係数の解釈方法は不明です。 抽象的でない限り-Dmitry Shepelyanskyが信じているように、タスクを正規化する。 そして、この場合にその価値は何になるでしょうか。



2.別の問題は、人々に関連して参照または音声と見なされるものに関連しています。 サイトの場合、音声の種類は1つだけです-ハイパーリンクですが、人々にとってはさまざまなものが音声と見なすことができます。 最も明白なのは、ブログやソーシャルネットワークでの友人のつながりです。 しかし、たとえば、トピックに対するコメントの存在は、基本的に「投票」でもあります。なぜなら、 このトピックは聴衆の関心と注目を集めました。 これには、いいね、リツイート、読書の事実なども含まれます。 要約すると、著者またはそのコンテンツに対する注意の表示は音声です。 ここからはまだ問題があります。



3.たとえば、ランダムリーダーからのカルマ音声は、友好的な接続と同等とは見なされません。 または、1つのコメントは、同じ著者からの通常のコメントとは異なります。 したがって、ソーシャルグラフをエンコードするマトリックス( 隣接マトリックス )には、債券の重みが含まれている必要があります。 私の知る限り、 Googleマトリックスの場合、関係は本質的にバランスが取れています。 1つのノードは、そこから発生する接続の数に反比例して傷を分散し、グラフ全体の接続の「強度」が異なることがわかります。 言い換えれば、数学の面では問題がないように思えますが、唯一の問題は重みの適切な定義です(それ自体は些細なことではありません)。



4.従来のPageRank式では、サイトへのリンクがある場合、ランクの送信値は負になりません。 任意のノードの傷の非負性により、解の存在に関するペロン-フロベニウスの定理を適用できます。 しかし、カルマによる声は否定的、コメントは否定的などになる可能性があります。ソーシャルグラフのノード間で負の傷の値を転送する可能性には、この設定でのランキング問題の解決策の存在と一意性の数学的な証明が必要なようです。



5.古典的なPageRankは同種のオブジェクトのネットワークに適用されます。 1つのタイプのオブジェクト-「サイト」。 しかし、上記のように、人をランク付けするとき、著者(カルマの声、友人とのつながり、LinkedInの推奨など)に直接、およびそのコンテンツへの反応を通して間接的に注意を示すことができます。 さらに、後者のケースはインターネット上で一般的です-私たちは個人の知人を通してよりもその内容によって人々を評価することが多いです。 また、著者とコンテンツユニットはすでに異種オブジェクトのネットワークを形成しており、たとえば、高評価の投稿がその著者に「投票」できます。 この投稿から判断すると、Witologyのランキング方法では、この状況が何らかの形で考慮されていました。 数学の観点では、 PRUFFI機関からの格付けは決して高度ではありませんが、別の重要な側面に焦点を当てています-人を格付けするとき、彼らが働いている組織の格付けを考慮することは理にかなっています。 組織が比較的抽象的なことを意味する場合-評価された人が参加するプロジェクトであれば、異なる種類のオブジェクトが互いに傷を送信する異種オブジェクトのネットワークも取得します。



6.実際の通信ネットワークでは、重みが異なるだけでなく、この重みも時間に依存します。 今日、人々は友人であり、明日は戦争になります。



前述の観点から、この問題は動的ネットワーク分析の現在開発中の分野に関連しているようです。



これは個人的に誤解であるため、7番目の点を書き留めたくはありませんが、4つのノードのネットワークでPageRankを計算する簡単なテストタスクでは、ノードに発信接続がない場合、すべてのネットワークノードの傷が最終的にリセットされることがわかります 1つの場所で、そのようなノードをすべて考慮から除外する方法を見つけました。 これは理解できますが、GoogleはPRの価値を、他のサイトへのリンクを持たないサイトを含むすべてのサイトに割り当てます。 別の場所では、発信接続のないノードは、他のすべてのネットワークノードへの発信接続を一度に持つノードに置き換える必要があると書かれています。 しかし、なぜこれを正確に行う必要があるのか​​、そしてこれがランキング結果にどのように影響するのかはあまり明確ではありません。



All Articles