リーダーの問題。 天国はどこか近くにありますか?

画像



ネットワーク上の私たちはそれぞれ、新しい興味深い情報を常に入手するための一連のサイトを持っています。 RSSアグリゲーターの使用を開始しようと何度も試みましたが、常にこの考えを捨てました。 パパのすべてのテープを辛抱強くレイアウトしたので、すぐに自分が思っていたものを受け取っていないことに気付きました。 .NETについて読みたい場合、記事はトピックに関係のない他の記事と混同されていました。 情報技術についてだけ読みたい場合もありますが、悲しいかな、私のルーブリケーターにはそのようなセクションはありませんでした。 しばらくして、読者を忘れました。



ソーシャルネットワークの出現により、ソーシャルグラフの全機能が興味深い資料を見つける問題の解決に役立つという希望が生じました。 しかし、「仮想の友達」を作る必要が特になければ、あなたはこのグラフの端にいます、そして、情報は届きません、そして、もしそうなら、それは非常に遅いです。 「人生は最高潮に達している」場所から離れると、大きなフレーズのエコーだけが聞こえます。 近づこうとすると、不必要な情報の山でいっぱいになり始め、あなたが望むものを手に入れる希望が失われます。 人々は写真を共有し、友人とチャットする必要があります。 親愛なる犬を喜ばせるために犬の写真をアップロードするのではなく、ソーシャルキャピタルの貯金箱のようになります。 私たちの時代に新しい経験と新しい知識を得るために努力している人はごくわずかであるという誤解を招く印象があります。



通常のソーシャルグラフを考えると、状況は次のようになります。 ノードAがノードBにとって興味深いコンテンツを公開する場合、AとBを接続するネットワークノードのチェーンのみがあれば、ノードBはそれを受信し、各ノードはこの公開を「承認」します。

画像



より多くの情報を取得するには、より多くのソーシャルコネクションが必要です。 しかし、それらが多すぎると、利益が出なくなります。 そのため、関心のあるグラフに目を向けた人もいました。



楽園への希望



ネットワークが広大であるため、「任意の型付き接続で接続された任意の型付きオブジェクトのモデル」が検討されました。 これに基づいて何を構築できるかを理解する試みが含まれていました。 Habréでは、このモデルの特殊なケースである関心グラフの概念が議論されました。 一番下の行は、すべての興味(タグ)が常に一意であるため、関連する視聴者全体がそれらに焦点を合わせているということでした。 次に、問題は特定のタグに関連するすべてを配置することでした。 これらの出版物の著者は、提案されたイデオロギーを使用してこの相互作用が構築される原理を概説しました。 最近、主要なソーシャルネットワークを含め、多くの人がこの概念に向けて対策を講じています。 多くの人と同じように、このアイデアを実装するサービスの開発を真の関心を持って見て、私は共有したい問題について自分の見方を持っていました。



このようなネットワークの開発に対する一般的な希望は、次の点で表現できます。



「理想的なソーシャルネットワーク」のイメージは、多次元情報空間への「窓」です。 この「ウィンドウ」は、現在のニーズを満たす情報のスライスを人に提供するように配置されています。 このコンテキストのニーズは、条件付きで2つの情報フローに分けることができます。一定のコンタクトが維持されるエリアからの更新と、ユーザーが関心を持っているエリアの更新です。 新しい社会的つながりは、地域のコミュニケーションサークルを通じて形成されます。 対話者は、関心が重なる状況で互いの活動を見ます。 プライベートデータの役割は小さくなります。 あなたの犬の年齢や現在の場所ではなく、あなたが誰であるかが重要です。



楽園はもうここですか?



この方向の主要なソーシャルネットワークの手順を検討すると、次のようになります。



公平に言えば、ハッシュタグは同様の機能を実装していると言わなければなりませんが、記事の1つにコメントを引用します-「同形緩和緩和について書いているものを読みたいなら、Twitterでどのハッシュタグを検索すればよいですか?」そのタグは便利で強力なものですが、何かが欠けています。 タグの主な問題は、1つの値(他の言語を含む)でタグを書くことの多重性です。逆もまた同様です-複数の値を持つタグの同じスペル。



グループについては、別に言います。 グループを関心に投影することは可能です。実際、これはアクティビティが関連付けられているのと同じ関心です-これは「志を同じくする人々」のグループのプロトタイプです。 また、グローバルな関心グループに不安がある場合は、「より深く掘り下げる」ことができます。 しかし、各グループには非常に多くの参加者がいます。 より多くの人がいる場合、これは大きなグループの「破壊」および/または同一のトピックの小さなグループの形成を引き起こします。 多くの人がusenetとfidoの会議を思い出します:「人がほとんどいなかったとき、人の数が増え、最高のものが残ったとき、それは面白かったです。」



グループの問題は、明確な境界があることです。 あなたはグループのメンバーであるかどうか。 出版物はグループに属し、境界線を離れません。 理想的には、出版物は、特定のトピック/関心/グループに異なる重みを関連付けるべきです。 人はさまざまな程度の興味を持っていますが、それに加えて、多くの興味がある可能性があり、興味ごとにグループを閲覧することは困難です。 興味に基づいて、ユーザーの単一のフィードを生成できます。



また、グループ間の接続の存在とそれらの相互の関係に注意する必要があります。 これは、この現象を研究し、彼らのプロジェクトでそれを使用するように一部を促します。 同じ関心の中に志を同じくする人々のグループがあり、それらの関係が「境界線」(共通)ユーザーを介して行われている場合、まさにそのようなつながりは、関心と志を同じくする人々のグラフのモデルにうまく適合します。 グループはそのような関係を「近似」しますが、同じ考えを持つグループとの関心はそれらをより調和的に表します。 グループの別の問題は、これらのコミュニティの参加者が他のコミュニティについて何も知らず、彼らについて何も聞きたくないということです。 彼らは、新しいコミュニティを自分たちの領土への侵入として認識し、貴重な情報の交換を妨げています。



上記を分析すると、この場合のグループは期待通りではないと結論付けることができます。 深刻な何かが必要な場合は、原則として、グループ管理者側の厳しい節度と全体主義的措置、エントリの禁止、公開で終わります。 関心はエンドツーエンドの関係を作成しますが。 関心(マーカー、タグ)は、関係のない階層間の絞り込み検索の可能性を調和的に実装します。



新しい楽園を築きます



頂点が人と関心であり、rib骨が任意のトピック(関心)に対するユーザーの注目の事実であるグラフを簡単に想像する場合、理論の説明のジャングルを掘り下げることはありません。



このアプローチは、このモデルに触発された多くのサービスに実装されています。 システム内の投稿は、特定のトピックセットに関連付けられており、関心のあるすべての「ファン」間のつながりを通じて広がります。 したがって、ネットワーク上のコンテンツの「配信」を提供します。



このシステムでは、いくつかの重要な問題が発生します。

  1. 利益の基盤を維持する方法は?
  2. ある関心の下でコンテンツをランク付けする方法は?
  3. 誤った出版物の利益。
  4. 不完全な出版権。


興味のベース


トピックのデータベースをユーザーに提供できます。 実践が示すように、これは混乱を招き、ベースには重複と重要でないトピックがいっぱいです。

カタログを修正し、必要に応じてサービス管理者の力でカタログを埋めることができます。 これには、初期コンテンツの問題、新しいトピックの追加の難しさ、したがってリソースの開発が伴います。

最善の解決策は、既存のルブリケーターを基礎とすることです。 ウィキペディアはすぐに思い浮かびます。 これは、カテゴリのディレクトリの役割に最適な、適切に構成された知識ベースです。 彼女の記事はそれぞれ、投稿を添付できる見出しです。



関心のあるコンテンツのランキング


コンテンツのランキングはかなり複雑なトピックであり、十分な数の記事が書かれています。 ソーシャルネットワークのグループを思い出すと、類似/同一のトピックのグループの出現は、ある関心の下でネットワーク内のコンテンツをランク付けしようとする何らかの試みと見なすことができます。



一部のトピックは、人々によって異なって知覚される場合があります。 関連性の問題はかなり複雑です。 さまざまな人々が、同じ関心でさまざまなコンテンツを見たいと思っています。 テーマを選択したとします。NETFramework。 個人的には、Hello Worldの書き方に関するエントリーレベルの記事には興味がありません。 私はこれらの素材を切り取り、多かれ少なかれ私にとって余分な結果を得たいと思います。 多くのソースがあるため、それらにはすべてさまざまな値のコンテンツが含まれているため、本当に興味深い出版物の検索に役立つツールを入手したいと思います。



大多数(病院での平均)で決定するのは悪い選択です。なぜなら、私たちはそれぞれ、コンテンツの質と生活の見通しに対して異なる要件を持っているからです。 したがって、この場合、さまざまな推奨アルゴリズムと発行のパーソナライズがより適切であり、そのトピックについてはあまり多くの資料が書かれていません。 私はすぐにこのアプローチの適用の支持者であると言います、私は数学とビッグデータを信じています。 しかし一方で、これらの技術には懐疑的です。 特に、十分な支持を受けている「フィルターバブル」の概念があります。



ウィキペディアでのバブルフィルターの説明は次のとおりです。 Eli Paraiserによって開発されたコンセプトは、ウェブサイトが選択的推測アルゴリズムを使用して、ユーザーの位置、過去のクリックとマウスの動き、および検索履歴に関する情報に基づいてユーザーが見たい情報を使用する現象です。 その結果、Webサイトには、ユーザーの過去のビューと一致する情報のみが表示されます。 これは、人々や組織が最初は自分にとって正しいと思われる情報を探す現象に似ていますが、完全に役に立たないかほとんど役に立たないことが判明し、不正確で重要ではないと思われ、認識されているが有用であることがわかっている情報を回避します。



彼の著書「The Filter Bubble」のParaserは、検索クエリのフィルタリングの潜在的な欠点は、「新しいアイデア、オブジェクト、および重要な情報から私たちを閉ざす」ことであり、「私たちの狭い関心事はすべて存在し、私たちを取り囲んでいます。」 これは、個人および社会全体の両方に潜在的な害をもたらします。 選択の自由は非常に重要です-人は情報を見つけ、その有用性を決定します。



私は、パーソナライゼーションのトピックに関する記事の1つに対するコメントが本当に好きでした。「婚約者に会うことはなかったでしょう。 彼らは私たちのようなハッカーと一緒に暮らすでしょう。」 それでも、米国の仮釈放委員会は、50〜100の要因に基づいて、特定の囚人に対して何をすべきかを推奨する特別なコンピューターアルゴリズムを使用しています。 私の意見では、問題はパーソナライゼーション自体ではなく、このツールのコントロールの欠如(オン/オフの切り替え以外)です。



そのようなネットワークでは、ユーザーにとって関心のある情報がより速く彼に届くと想定することができます。 ユーザーは、(自分の意見では)高品質のコンテンツをより高い確率で受け取ります。



誤った出版権


一部のユーザーは、パブリケーションの最大の配布を達成しようとして、それらに関係のないトピックの過剰なセットを形成します。 これにより、彼らはプロジェクトの本質を破壊します。 サービスをゴミに変えないようにする効果的なツールが必要です。

Habraの実践が示すように、情報を「収集」して整理する人がいるはずです。 しかし理想的には、アルゴリズムにタスクを与えたいと思います。



不完全な出版物の利益


「利益のグラフ」の概念を実装する主なタスクは、情報が関連するすべての利益に結び付けられていることを確認することですが、同時にこれらの利益は互いに異なる重みを持っています。 そして、この関心の重みは、本当に興味を持っている人にとってより正確な情報の配信を形成するでしょう。 この場合、コンテンツの自動分類が役立ちます。



エピローグ



上記の各タスクは、個別の議論に値します。 これらは、Habréで言及されているものを含め、さまざまなプロジェクトによってさまざまな程度の成功を収めて解決されていると言わなければなりません。

将来、私の決断についてお話したいと思います。 技術面とアルゴリズム面の両方で、それぞれを実装することの難しさについて考えを共有してください。

この出版物でお時間をいただきありがとうございます。



関連出版物



  1. 理想的なソーシャルネットワーク、オタク誌
  2. インタレストグラフ:ネットワークにおける相互作用の新しい原理、オタク誌
  3. News360パーソナライゼーションシステム:ランキング情報クラスター、オタク誌



All Articles