他のインターネットユーザーが現在読んでいるものを知りたいですか?

人々の目 次に、Google Chromeの拡張機能を試すことを提案します。これにより、この要望を満たすことができます。 「人の 」と呼ばれ、アイデアによれば、現在読んでいるネットワークユーザーの中で最も興味深いものを表示する必要があります。

要するに、彼の作品の本質は次のとおりです。 拡張機能は、ブラウザユーザーのアクティビティを監視し、「いつ」どこに「行った」かに関する情報を記録し、定期的にサーバーにデータを送信します。 サーバーは、リアルタイムで受信した情報を統合し、絶えず変化する人気コンテンツのレーティングを生成および維持します。 この評価は、リンクの短いリストの形式で拡張機能のすべてのユーザーに返されます。 実際、訪問したインターネットページの交換が行われているため、現在他の人にとって何が面白いかを知ることができます。

訪問したリソースを共有するこの方法の利点は次のとおりです。



将来的に現れる可能性のある潜在的な利点、および特定の欠点がありますが、それらについては少し低くなっています。

そして、拡張機能をインストールしようとするか、必要ないと判断する前に、なぜ安全なのか、どのように機能するのか、実際に何のために作成されたのかを少しお話ししましょう。



このシステムの背後にある考え方は非常に簡単です。 したがって、彼女が私の頭に浮かんだとき、おそらく似たようなものがすでに存在していると確信していました。 しかし、検索した後、私は近くに何も見つけられなかったので、自分でやろうとすることにしました。 おそらく、私はただ見苦しかった。 したがって、誰かが同様のものへのリンクを共有する場合、私は興味を持って見ます。 いずれにせよ、私の頭の中にあるこのシステムの可能な開発は、おそらく既存のものとは異なり、これも少し低いです。



安全性


おそらく最初に発生する可能性のある公正な質問の1つは次のとおりです。 しかし、この拡張機能が、ユーザーが閲覧したページにある可能性のある機密情報を取得して共有し始めることはありませんか? 答えようとします。

まず、拡張機能はユーザーが表示したコンテンツからコンテンツを送信しません。 訪問したページのURLのみがサーバーに送信され、ユーザーの行動に関する追加情報が添付されます。 現時点では、これは対応するリソースに費やされた時間のみで構成されています。 background.htmlファイルを見て、これを確認できます。 拡張機能がこれを実行したい場合でも、適切な権限のないコンテンツスクリプトが含まれていないため、拡張機能は実行できません。 そのため、拡張機能のインストール中に、「すべてのWebサイトの個人データにアクセスできる可能性がある」という警告は表示されません。

次に、ランク付けされる前のアドレスは、サーバーによって可用性がテストされます。 したがって、ページが無料のアクセスから保護されている場合、そのアドレスでさえも間違いなく「私たちの間」のままです。

第三に、評価構築アルゴリズムは、評価に「ランダムな」ページが表示される可能性を最小限に抑えるように設計されています。 これは正式に開いているものを指しますが、幅広い視聴者の目の前に表示されることは望ましくありません。 そのようなイベントの可能性を妨げる主なものは、多くの異なる人々が訪れたページの決定的な利点です。

「Eye of the People」拡張ウィンドウの例 それにもかかわらず。 このテキストを書いている時点では、拡張機能はまだパブリックドメインで公開されていません。 このストーリーの目的は、公開直後に目立った数のユーザーを惹きつけ、意味のないパフォーマンスを提供することです。 したがって、あなたの1人は非常に最初の実際のユーザーの一人になります。 ユーザーリンクの相対的な重みは、その数が少ない場合、当然ながら非常に高くなります。 最初の使用期間の特性に関連する歪みの影響を軽減するために、一方ではユーザーリンクを「強調」する可能性を支配するいくつかのパラメーターを「強化」し、もう一方では退屈しないように、関連しないセミランダムリンクの可能性を追加しましたユーザーアクティビティ。 それらは初めてリストで確認できます(図の例)。 これまでのところ、リスト自体は短くなっています。 特定の数のユーザーが収集されたら、この外部ソースを切断し、リストの信頼性を高めます。

これらすべての状況にもかかわらず、特定のページがリストに表示されないことを100%保証したい場合は、まずシークレットモードで開くことができます(このモードでは、デフォルトで拡張機能がブロックされます)。



仕組み


システムの仕組みについてもう少し説明します。

リソースの人気を評価するための基礎として、2つの特性が使用されます。現在の瞬間から一定時間経過してリソースを訪問したユーザーの数と、各ユーザーが示すリソースへの個々の関心の指標です。 関心のあるインデックスは、特定のページの閲覧に費やした時間の非線形関数として計算されます。 時間だけを考慮することはむしろ失礼です。 しかし、最初のバージョンについては、かなり受け入れられると思います。 将来的には、動作の追加特性とページ自体の機能を考慮して、これを改善できます。

「人の目」の仕組み 拡張機能は各Webページの時間を測定し、蓄積されたデータを定期的にサーバーに転送し、それに応じて現在の評価リストを受け取ります。 転送されたデータは、次のリクエストの評価に反映されることは明らかです。 現在、リクエスト間の間隔は通常5分ですが、この値は特定の状況下で変化する可能性がある変数です。

サーバーは、ユーザーから受け取ったデータを自分の「貯金箱」に追加します。 サーバーは、一定の周期で、アクティブユーザーの貯金箱を「プリントアウト」し、関心指標を計算し、そのタイムスケールを取得し、さまざまなユーザーからのデータを統合して、所定の各時点で利用可能な各ページの人気の推定値に変換します。 別の特定の頻度で、サーバーは評価を作成します。 これを行うために、過去の特定の深さで蓄積された人気の「即時」推定値の配列を分析します。 分析の過程で、これらの評価はすでに最終版にまとめられています。 これには、ページにアクセスしたユーザーの数と、各「インスタント」評価の関連性(より最近-関連性が高い)が考慮されます。 既存のページのリストは、ソートされ、切り捨てられ、チェックされ、フィルタリングされ、最新の状態になります。 ビューの深さ-現在のユーザーアクティビティに応じた変数値。 範囲は、数時間から半日です。



開発


現在の形であっても、このシステムが誰かにとって興味深いものになることを願っています。

しかし、私にとっては、その作成はほんの小さなステップに過ぎず、実際に私が興味を持っているアイデアの実装に近づくことができるでしょう。

私たちの多くは毎日ニュースを読んで、私たちの個人的な好みに基づいて、自分にとって新鮮な何かを探します。 これを行うには、検索、RSSリーダー、友人のフィードを使用し、お気に入りのサイトを検索するだけでなく、さまざまな方法を使用します。 現在、新鮮なコンテンツの流れはかなり大きく、フィルタリングに時間がかかる場合があります。 はい、あなたの好みに基づいてこのストリームをカスタマイズする多くの方法がありますが、これは常に機能するとは限りません。

この問題を考える際に、ネットワーク上の人の行動を研究し、得られたデータに基づいてその利益のために学習するシステムのアイデアをどういうわけか考えました。 これらの関心に基づいて、このようなシステムは、必要に応じて、常に受信する新しいコンテンツのフローに適用される個人フィルターのセットを自動的に構築および変更します。 また、ユーザーは、特別なアクションを必要とせずに、既に「選択的な」コンテンツを提供されます。

ユーザーグループの割り当て ブラウザ拡張機能を使用してシステムに戻ります。 彼女の仕事の過程で、彼女は訪問したWebページの「ホット」リストを常に持っています。 このリストの多くの要素が多次元空間の座標系を定義し、対応する対象のインジケーターの値がこの空間のユーザー定義の点に関連付けられた点の位置を決定すると言うことができます。 互いに近いポイントのグループを区別し、同時に他のポイントから削除することに成功した場合、特定の意味で同様の関心を持つグループにユーザーを分離します。 次に、選択したユーザーグループのフレームワーク内で独立した評価を構築すると、特定の人々の関心に焦点を当てたリストが既に多数得られます。 また、これらのリストは、「スポーツ」や「政治」などの人為的なカテゴリではなく、より自然なパーティションによって決定され、ユーザーの興味に関連する結果が得られます。

次に、ページのコンテンツの分析を直接接続できます。 コンテンツを分類することを学べば、システムのユーザーがカバーしていない部分を含む情報フロー全体を接続する問題を解決することが現実になります。

もちろん、多次元空間内のユーザーポイントを使用して、与えられたモデルを文字通りに使用しないでください。 これはアプローチの実現可能性を示すものであり、実装はわずかに異なる場合があります。 これはまだ私の考えの中にあるので、これ以上詳細には立ち入りません。 詳細は、現在のシステム実装の開発を通じて受け取ることを期待しているデータ調査に基づいている必要があります。

この非常に現在の実装の結果が、平凡で、拡張ユーザーとしてのあなたにとって面白くないことが判明する可能性は十分にあります。 しかし、アイデアを理解することで、しばらくの間、緑色の目がのぞくのを防げるようになるかもしれません(ところで、拡張ボタンを右クリックすると、[ボタンを隠す]オプションがあります)。



欠点について


今日の主な欠点は、ユーザーの不足です。 そのようなシステムの結果があまり信頼できないことは明らかです。 たとえば、この出版物はHabréに掲載されたため、最初は生成された評価はHabréの記事の評価の一種になります。 時間が経つにつれて、それ自体が修正されることが望まれます。

また、システムは到着したURLを事前に分類していないため、GMailなどの大規模なサービスや人気のあるリソースのメインページ(habrahabrが再び表示されるなど)によって評価のトップラインがすぐに占有されることも明らかです。 これらのケースは徐々に、意図的にフィルタリングする必要があり、おそらく別の評価を組織する必要があると思います。 しかし今のところ、私はあなたと何が起こるかを見たいです。

設計上、生成されたリストで、何らかの理由で見逃していたかもしれないものから、私たちにとって興味深いものを見たいのは明らかです。 提案された方法がこれらの期待に応えるという保証はありません。 そして、私はこのシステムを何かに代わるものとしてではなく、入ってくる情報の流れを見るための別の方法としてのみ考えることを提案します。

拡張機能をインストールしたい人の数、負荷がどのようになるか、どのように配布されるかはわかりません。 もちろんシステムをテストしましたが、それは「人工」モードでした。 したがって、何かがうまくいかない場合は、可能性のある「誤解」について事前に謝罪します。

これで、テキストを公開する前に、拡張機能を公開できます。 そして、来年の新年にすべての読者の幸運を祈ります!



All Articles