タグは芋出しを打぀こずができたすか タグ階局

セクション、カテゎリ、ハブ、およびその他のファセット分類が果たす圹割など 私たちのオンラむン生掻の䞭で。 圌らずのすべおがずおも明癜ですか

これらの抂念はすべお、過去の論文から私たちにもたらされたした。その埌、厳密な䜓系化が、本や文曞をナビゲヌトする唯䞀の方法でした。 最初は、むンタヌネット環境では、芋出しがほずんど唯䞀のナビゲヌト方法でした。 カタログは繁栄し、 増加したした。Yahooはカタログを320億ドルの資本金を持぀倧成功プロゞェクトに倉えた奜䟋です。



タグが芋出しを獲埗したす。ボッシュ



しかし、怜玢技術の開発は、カタログずルヌブリックの信頌性ず関連性を倧きく損なっおいたす。 恐竜ず同じように、倧きくお䞍噚甚なカタログは機敏で略奪的な怜玢゚ンゞンによっお砎られたした。

Web䞊のグロヌバルナビゲヌションの分野で敗北したしたが、別の生態孊的なニッチ、぀たりサむトで-ルブリケヌションは䟝然ずしお叀兞的なナビゲヌションツヌルです。



その埌、タグたたはショヌトカットが登堎し、このツヌルは旧匏で柔軟性に欠けるアプロヌチずしおルブレヌションに取っお代わるず思われたした。 しかし、いや、誰もが自分自身で残った。 そしお、倚くの堎合、同じ情報スペヌスでルブリケヌションずタグ付けが共存しおいるこずがわかりたす。



なぜタグは玠晎らしい啓瀺ず墓掘りになっおいないのですか



私には次の理由がありたす

1.芋出しは、この情報源の䞀般的なトピックりェブサむト、りェブログなどをよく瀺しおいたす。 事前にコヌミングされおおり、タグが受ける奇劙さの圱響を受けたせんモデレヌトされおいない限り



2.同様に、セクションに配眮されおいるコンテンツはほずんどの堎合正しくそこに配眮されおいたすが、提䟛されるタグはタグを付けた人の䞻芳的な意芋にすぎたせん。



3.フォヌラム゜リュヌションでは、芋出しが投皿のモデレヌションの基瀎ずなりたす。 ぀たり、ナヌザヌによっお生成されたコンテンツは、倚かれ少なかれ関連するセクションに分類される可胜性がありたす。 そしお、これは曞くこずはせず、読むこずをする人たちの生掻を簡玠化したす。



4.分類タクシヌ-ルヌブリケヌションがナビゲヌションの基瀎であるオンラむンストアおよびその他のシステム。



合蚈するず、ショップ付きのアむテムを陀き、ルヌブリケヌションの他のすべおの利点は、ルヌブリックに含たれるコンテンツの品質の予枬可胜性に垰着したす。



぀たり、反察の方向を芋るず、タグを芋るず、メッセヌゞラベルずしおもメッセヌゞ品質の指暙ずしおも、あたりにも予枬䞍可胜です。



䞀方、タグもルヌブリケヌションであるこずは盎感的に明らかですが、より䞀般的か぀民䞻的な方法であるため、この民䞻的な性質のため、タグはルヌブリックを倱いたす。 過床の自由は䞍確実性に぀ながりたす。



たずえば、ナビゲヌタをタグずしお䜿甚し、メッセヌゞのコンテキストではナビゲヌタを䜿甚する堎合、これは1぀のこずです。

携垯電話に関する次のニュヌスを読んで、そこに「カバレッゞ」ずいうタグがありたす。 このタグをクリックするずき、実際には、リンク「モバむル通信」+「カバレッゞ」をクリックする必芁がありたす。

テキストが特に牛の繁殖に関するものである堎合、タグ「cover」には「牛」+「カバヌ」ずいう異なる意味がありたす。

たずえば、コンテキストなしでタグに䌚った堎合、サむトのタグクラりドでそれらを芋ただけで、「カバレッゞA」ず「カバレッゞB」を区別する方法は



ファックオアコヌル



読者の興味の歎史を知っおいる堎合にのみ、タグのセマンティックコンテキストの明確な解釈が可胜になりたす行動分析。 ぀たり、読者が通垞「ネットワヌク」、「モバむルネットワヌク」などのカテゎリのテキストを詳しく調べおいる堎合、「カバレッゞ」ずいうタグによっお圌の意味を理解できたす。 そのような情報がない堎合、すべおは通垞通りです...



どうする



タグ付け技術の開発の芳点から、これはこれを意味したす



タグを䜿甚しお怜玢する


1.疑わしい堎合には、1぀のタグではなく、䞀連のタグを䜿甚しおメッセヌゞの遞択を取埗するこずをお勧めしたす。

2.このセットは、メむンタグ投皿を遞択するための基準ずしお泚文されたタグず远加、぀たりナヌザヌが「頻繁に攟牧する」ラベルで構成できたす。

3.もちろん、远加のタグは、倚くの堎合、メむンず䌚う必芁がありたす。぀たり、「接続」されおいる必芁がありたす。



タグ付け


はい、これが最も匱い点です。 タグは通垞䜜者によっお付けられたすが、これは非垞に䞻芳的なものであり、フォヌク゜ノミヌの実隓はただ奚励されおいたせん。 タグ付けをより厳密にするために、他のいく぀かのメカニズムが必芁です。 最も可胜性が高いのは、同矩語たたは類䌌性の怜玢を䜿甚した䜜業の圢匏でのタガヌぞの節床およびヘルプメカニズムです。



階局


タグは単なる単語ではなく、サブゞェクト領域に属するこずを暗瀺する単語組玐髪型、組玐海岞、組玐道具です。

぀たり、タグは少なくずも2぀のパラメヌタヌ単語、サブゞェクト゚リアです。

たた、サブゞェクト領域は、ゞョむントの倖芳によっお緊密に接続されたタグのコレクションです。



タグ階局には倧きな可胜性がありたす。 これらの階局は自然なものです。぀たり、ナヌザヌがパスずしお螏みにじり、デザむナヌが䜜成したものではありたせん。



前文は終わったず蚀えたす。 以䞋は、数孊者セルゲむ・リボフの非垞に具䜓的なレシピです。 圌がHabré popolznev の声を䞎えられるこずを本圓に願っおいたす。



タグ階局の最初のステップ



著者 セルゲむ・リボフ



1.䜕が欲しい



ネットワヌクコミュニティネットワヌクはコンピュヌタヌネットワヌクを想像しおください。メンバヌは曞面でコミュニケヌションを取りたす。 メッセヌゞ投皿、ステヌトメント、メモ、発蚀、䞀臎は保存され、さたざたな方法で混乱をクリヌンアップしたり、接続を確立したりするこずができる倧きな山を圢成したす。



物事を敎理する方法の1぀、あるいは、メッセヌゞのヒヌプ内に構造を圢成する方法の1぀は、タグテヌマラベルを䜿甚するこずです。 ナヌザヌ自身がショヌトカットを考え出し、それらをメッセヌゞに垰属させるこずが想定されおいたす。 コミュニティのメンバヌはショヌトカットの䜜成に制限されおいないため、倚くのショヌトカット自䜓が倧きな山になり、ショヌトカットが構造を圢成するためのツヌルになるためには、それら自䜓を敎理する必芁がありたす。 ヒヌプをクリヌンアップするには、基本的にも基本的にも異なる2぀の方法がありたす。手動ず自動です。 もちろん、2番目の方法に興味がありたすが、おそらく、手動で調敎しないずできない堎合がありたす。



ラベルはメッセヌゞの「テヌマの性質」に責任があるため、ラベルのヒヌプに順序を付けるこずは、2぀のラベルがテヌマ的に互いにどのように近いかを瀺すこずができる尺床を確立するこずを意味したす。 この枬定は

単語の数孊的意味でメトリック=距離ずしお配眮されたす぀たり、2぀の異なるラベルの堎合、ラベルのリストの順序に関係なく、ラベル間の距離は正の数でなければなりたせん;からの距離

それ自䜓ぞのラベルはれロです。 しかし、盞関係数完党に無関係なラベルの最小倀は0、最倧倀は1のような枬定を行う方が䟿利だず思われたした。 さらに、この係数は察称である必芁はありたせん。2番目のラベルを1番目のラベルよりも匷く貌り付けるこずができたす。



2.芁玠ず指定



Mは、マッシュルヌムに保存されおいるすべおのメッセヌゞのセットを瀺したす。M = { m 1 、...、 m N }。 セットMが時間の経過ずずもに倉化し、メッセヌゞの数が増えるこずは明らかですが、ダむナミクスには関心がありたせん。システムを任意の固定瞬間に怜蚎したす。 Sは、システムで珟圚䜿甚可胜なすべおのタグタグのセットです。S = { s 1 、...、 s NN }。 察応関係はセットMずSの間で定矩され、これはゞオメトリずの類掚によっお倚くの読者はグラフ理論で蚀う-しかし、圌らはゞオメトリを思い぀いた、むンシデントず呌ぶこずができたすメッセヌゞmずラベルsは 、メッセヌゞmが s 。



リトリヌト 。 小屋の議論における行動の芏則は、メッセヌゞの䜜者だけがメッセヌゞにラベルを掛ける暩利を持たないようにするこずができたす。 しかし、タスクにずっおこれは重芁ではありたせん。メッセヌゞにラベルを付ける人は誰でも、問題の瞬間にシステムはその状態に固定されたす。 重芁なのは、メッセヌゞずラベルが付随的であるかどうかです。



s 1、...、 s rがメッセヌゞmをマヌクするラベルである堎合メッセヌゞmのタグセットを定矩できたす S  m = { s 1 、...、 s r }、量e [s 1 ]  m 、...、e [s r ]  m 、これらはメッセヌゞmの タグ付き倀ず呌ばれたす。 それらがどのように正確に蚈算されるかは、今私たちにずっお非垞に重芁ではありたせんが、蚈算されるべきです

メッセヌゞの重芁床が高いほど、重芁床が高くなるようにする必芁がありたす。 倧雑把に蚀えば、メッセヌゞの重芁性は、メッセヌゞによっお読者に公開される「プラス」の数です。 システムの機胜プラス蚘号はメッセヌゞだけでなく、ラベルに付けられたす。



メッセヌゞ自䜓の遺䌝的関係が考慮されたす。各メッセヌゞには「子孫」ず「先祖」「先祖」を含めるこずができたす。 メッセヌゞm 2がメッセヌゞm 1に応答しお曞き蟌たれる堎合、メッセヌゞm1はm 2の盎系の祖先たたは先行、およびm 2-盎系の子孫ず呌ばれたす。 メッセヌゞm 1の盎接の子孫であるメッセヌゞに応答しおメッセヌゞm 2が曞き蟌たれる堎合、 m 2はメッセヌゞm 1の盎接の子孫たたは単に子孫ず呌ばれたす。 メッセヌゞm 2がメッセヌゞm 1の子孫であるメッセヌゞに応答しお曞き蟌たれる堎合、 m 2はメッセヌゞm 1の盎接子孫ずも呌ばれたす。 盎接の祖先先行も同様に定矩されたす。



3.アプロヌチ番号0倖芳統蚈



私たちが構築しおいるシステムは䜕も理解しおいたせん。 圌女にずっお、ラベルは単なる文字のセットです同音異矩語の問題を角かっこから倖したす-それは䜕らかの圢で解決されるず仮定したす。 したがっお、システムは、ラベルの共同出珟の頻床に基づいお、ラベルのテヌマの近接床のみを評䟡できたす。2぀のラベルが頻繁に䞀緒に芋぀かった堎合、テヌマ的に近いず仮定するのは自然です。 µ [ s ]でタグ付けされたメッセヌゞの数、 µ [ u ]でタグ付けされたメッセヌゞの数、 µ [ su ]でsずuでタグ付けされたメッセヌゞの数を同時に瀺したす。



ラベルsおよびu の䞻題関係係数を決定する最初の詊み



ρ0  s 、 u = µ [ su ] / µ [ s ] + µ [ u ] -µ [ su ] 。 1



分母の倀は、ラベルs 、 u の少なくずも1぀が提䟛されたメッセヌゞの数です。

悪い匏1ずは䜕ですか たず第䞀に、すべおのメッセヌゞを実行したす-これは非垞に長い時間になるこずがありたす。 䜜業量を枛らすために、適切なメッセヌゞを遞択しおおくずいいでしょう。 さらに、この状況は可胜です。 明らかです

倚くの堎合、子孫メッセヌゞは芪からラベルを継承したす。 たた、システムたたはフォヌラムたたは同じLJで長いダむアログスレッドが開始されるず、そのスレッドは参加者以倖の誰にずっおも興味を匕くものではなくなり、統蚈を歪める可胜性がありたす。



このような出口が可胜です。 耇数の盎接の子孫がある堎合、メッセヌゞノヌドを呌び出したす。 さらに、 µ j [ s ] 、 µ j [ u ] 、 µ j [ su ]を 、それぞれラベルs 、ラベルu 、ラベルsおよびuで同時にラベル付けされたノヌドメッセヌゞの数ずする。 ここで、䞀般的なすべおのメッセヌゞではなく、匏1を修正したすが、

節点のみ



ρ0 j  s 、 u = µ j [ su ] / µ j [ s ] + µ j [ u ] -µ j [ su ] 。 2



匏1の1぀の欠陥を取り陀きたしたが、それだけではありたせん。 匏1ず匏2が察称であるこずは良くありたせん。実際、ラベル間の関係は非察称です。 しかし、それを修正するこずは難しくありたせん。



ラベルsのラベルuぞの䟝存係数を玹介したす。



ρ1 j  s 、 u = µ j [ su ] / µ j [ s ] 3



この匏の意味は単玔です。ラベルsがラベルuずは別に出珟する頻床が高いほど、ラベルsのラベルuぞの䟝存性が少なくなりたす。



2぀の匕数の堎所に同じラベルを代入するず、3぀の匏すべおが統䞀性を䞎えるこずに泚意しおください。぀たり、 ρ0  s 、 s = ρ0 j  s 、 s = ρ1 j  s 、 s = 1これは正芏化の自然な条件です。



さらに進みたしょう。 これたでに提瀺したすべおの匏で、重芁な芁玠は2぀のラベルが同時に発生する頻床です。 ただし、2぀のラベルのセマンティックな近接性が、同時ラベルの理由になる堎合がありたす。

非発生。 たずえば、ある人がトマトず呌び、別の人がトマトず呌ぶものですが、あるナヌザヌは垞に「トマト」ずいうラベルのみを衚瀺し、他のナヌザヌは「トマト」のみを衚瀺したす。 「トマト」ず「トマト」の類矩語のステヌタスの先隓的垰属を陀倖する堎合これたでのずころ、そのような方法を考慮から陀倖したした、ラベルの近さをキャッチするこずを期埅できたす。 たずえば、「ホモロゞヌ」ずいうラベルが「トポロゞ」ずいうラベルずよく䞀臎し、「ホモトピヌ」ずいうラベルが「トポロゞ」ずいうラベルずよく䞀臎する堎合、ホモロゞヌずホモトピヌに぀いお䜕も知らなくおも、これらには䜕かがあるず仮定できたすその埌、䞀般的に、テヌマ的に閉じたす。 正匏には、これは次のように衚珟できたすノヌドメッセヌゞのみを考慮しおいたす。



ρ2 j  s 、 u = max v∈S µ j [ sv ] / µ j [ s ] µ j [ uv ] / µ j [ u ] 。 4



ただし、ここでは再び察称に戻りたした。構成により、 ρ2 j  s 、 u = ρ2 j  u 、 s です。 この察称性の意味は、3番目のラベルを探しおいるこずです。これには、比范される2぀のラベルが近いでしょう。 垞にρ2 j  s 、 u ≥ρ1 j  u 、 s  u = vおよびs = vの堎合 、匏4の右蟺の括匧内の因子の1぀は1であり、2番目はρ1 j  u 、 s ず䞀臎したす。぀たり、倀ρ1 j  u 、 s は確実に達成され、最倧倀が倧きくなるこずがありたす。



数匏を豊かにするこずもできたす



ρ3 j  s 、 u = maxmax v∈S µ j [ sv ] / µ j [ s ] µ j [ uv ] / µ j [ u ] 、max v∈ S µ j [ sv ] / µ j [ s ] µ j [ uv ] / µ j [ v ] 。 5



4.他のアプロヌチの可胜性



前の段萜で䞎えられたすべおの匏は、統蚈に基づいお䞻題の近接床を掚枬しようずしたす。 他に䜕ができたすか あなたは私たちの小屋の議論の機噚を䜿甚しようずするこずができたすその䞻なこずを芚えおおいおください

ハむラむトは重芁なシステムです。 匏1〜5のいずれも、次の方法で倉曎できたす。 異なるむンデックスを持぀数倀µは、特定の条件を満たすメッセヌゞの数ですこの条件は、 µに割り圓おられたむンデックスがこれを正確に担いたす。 メッセヌゞの数は1単䜍の合蚈です必芁な条件を満たす各メッセヌゞに察しお、1でなく1がµに远加されたす。1ではなく、メッセヌゞの重芁性に䟝存する倀を远加したす少なくずも2぀のラベルがすべおの匏に含たれるため、倀を䜿甚できたす少なくずも2぀、さらに埮劙な数匏を取埗したす。 しかし、この埮劙な善ぞの埮劙さは難しい質問になるでしょう。 これに぀いおは今すぐ詳しく説明したせん。埌で延期したす。



どうやら、すでに述べた以䞊に、「手䜜業」ず管理緩和の方法だけが残っおいたす。 たずえば、いく぀かのテヌマブロックを事前に䜜成しお、ナヌザヌが新しいショヌトカットを開始するたびに、ブロックの1぀にこのショヌトカットを配眮するように求め、既存のショヌトカットぞの階局関係たたはバむンディングを確立できたす。



All Articles