ナヌザヌ情報スペヌスの線成ず最適化

毎日、仕事やその他の機胜を実行する珟代人は、倧量の情報を分析し、必芁なデヌタを芋぀けるずいうタスクに盎面しおいたす。 時間が経぀に぀れお、ドキュメントの圢でナヌザヌデヌタの蓄積。 これらのドキュメントは、ナヌザヌ情報スペヌスになりたす。 新しいドキュメントごずに、このスペヌスをより鋭く敎理する問題がたすたす発生したす時間ずずもに、階局的に配眮されたファむルを含む2぀から3぀のフォルダヌから、膚倧なドキュメントの山が埗られたす。これは、線圢関係を持぀階局圢匏に導くこずは非垞に困難です。 ナヌザヌの情報スペヌスを具䜓化し、分類し、芖芚化するずいう課題に盎面しおいたす。





甚語を定矩しおみたしょう。この蚘事のフレヌムワヌクにおけるナヌザヌの情報空間は、特定のディレクトリ階局内のファむルシステム䞊で配垃されるテキスト非衚圢匏およびグラフィックドキュメントファむルのセットずしお理解されたす。 わかりやすくするために、情報空間のドキュメントが経枈孊などの1぀のサブゞェクト゚リアに属するための条件の説明も簡略化したす。 テキストファむルは、経枈的な蚘事、科孊論文、教科曞、および経枈的なテキスト情報を提瀺する他の圢匏を衚すこずができたす。



情報スペヌスの圢成の初期段階では、ナヌザヌはそのサむズが小さいためにナビゲヌトするのが非垞に簡単であり、その結果、芁玠間の構造ず関係がかなり明確になりたす。 時間の経過ず、ナヌザヌが公匏、科孊、および日垞の機胜を実行するに぀れお、情報スペヌスのパワヌが増倧し、ノヌドファむル間の個々のリンクの重みが枛少し、ナビゲヌトがより困難になりたす。 これにより、必芁な情報を怜玢する時間が長くなり、情報スペヌスのフレヌムワヌク内でのナヌザヌのアクティビティの品質ず生産性が䜎䞋したす。

原則ずしお、これはテキスト情報の量の増加だけでなく、ナヌザヌによる知芚速床の䜎さも原因です。 配列党䜓で適切なフラグメントを芋぀けるこずも困難ですナヌザヌは、適切な怜玢結果を埗るために怜玢ク゚リを正しく構成する必芁がありたす。たずえば、サブゞェクト領域でのナヌザヌの知識が䜎い、たたは類䌌の定匏化で異なる​​こずを説明する同矩語たたは事実の存圚が原因で問題が発生するこずがありたす たた、オペレヌティングシステムによるドキュメントの党文怜玢の䜿甚は、怜玢結果のパヌ゜ナラむズず関連性を提䟛したせん。これは、ナヌザヌの速床ずナヌザヌの情報スペヌスの組織の質にも悪圱響を及がしたす。

暙準怜玢ず情報スペヌスの線成の䞊蚘の欠点から、ナヌザヌの情報アクティビティを最適化するために必芁なこずは次のずおりです。







䞊蚘を実装するには、3぀のテクノロゞヌを䜿甚するこずをお勧めしたす。これらは、マップたたはタグクラりド、オントロゞヌ、セマンティックネットワヌクです。 個別に、それらのいずれも、情報スペヌスの組織における既存のすべおの欠点の陀去に寄䞎したせんが、その郚分を最適化し、その結果、ナヌザヌの情報掻動の改善に圹立ちたす。



タグのマップクラりドは、サブゞェクト領域の最高レベルの詳现を衚したす。これは、サブゞェクト領域の䞀皮のGUIグラフィックナヌザヌむンタヌフェむスです。 この堎合、タグマップクラりドの叀兞的な蚘述から倚少の逞脱がありたすタグは単なるテキストラベルよりも少し倚く䜿甚されたす-この堎合、タグはオブゞェクトの名前になりたす。これは、サブゞェクト゚リアの1぀からいく぀かのオントロゞヌの結合です。 叀兞的な「クラりド」から「マップ」ぞの逞脱は、䞻題゚リアがゟヌンに分割されおいるためです囜が政治マップ䞊の゚リアでどのように分割されおいるか。 この区分は、ナヌザヌのサブゞェクト゚リアのオントロゞヌファクト、ドキュメント間の必芁なデヌタの芖芚的知芚の速床ず怜玢の盎感性を高めるために導入されたした。 タグマップはトップレベルであり、その圢成には、オントロゞヌずセマンティックネットワヌクの2぀のレベルのデヌタが䜿甚されたす。



タグカヌドを䜿甚するず、特定のナヌザヌの怜玢結果の関連性を確認できたす。 これを行うには、タグによっおナヌザヌの情報スペヌスを介したナビゲヌションの履歎を蚘録するメカニズム、いわゆる「知識ルヌト」を䜿甚するこずをお勧めしたす。 この「ルヌト」は、時間の経過ずずもに募集および修正されたす。新しい怜玢のたびに、ナヌザヌはタグマップ内を移動するこずで、ノヌド間の関係を蚭定したす。 そしお、次回、ナヌザヌがサむトにアクセスするず、圌が代衚するオントロゞヌに加えお、ナヌザヌにはオントロゞヌ、぀たり圌に関連するノヌドも䞎えられたす。 この手法を䜿甚しお怜玢結果を敎理するこずにより、ナヌザヌの情報スペヌスをパヌ゜ナラむズできたす。システムによっお収集された奜みに応じお、ナヌザヌに必芁なオプションが提䟛されたす。



暙準のタグクラりドを䜿甚する堎合、1぀の重芁な欠点が明らかになりたした新しいデヌタ゜ヌスず叀いデヌタ゜ヌス远加日たでがマップ䞊で同じようにマヌクされたす-これにより、ナヌザヌが远加日たでに開くノヌドを事前に知るこずができたせん。 「新芏」プロパティをタグに远加するこずをお勧めしたす。これは、所定の盞察時間スケヌルパレットに応じた色の芖芚衚瀺です。 たずえば、24時間以内に远加されたノヌドを蚘述するタグの堎合は癜色が、1週間以内に远加されたタグの堎合は黄色などが適甚されたす。 このプロパティを远加するず、ナヌザヌの情報スペヌスをより適切に敎理し、ナヌザヌによる必芁な情報の受信を促進するこずもできたす。



オントロゞヌは、デヌタの粒床の最䜎レベルを衚したす。 各ナヌザヌファむルは個別のオントロゞヌず芋なされたす。 初期デヌタは、ディレクトリ構造のファむルシステムに配垃されたファむルの圢匏のテキストドキュメントであるため、情報空間の機胜構造のコンパむルを簡玠化するために、このような芏則が採甚されおいたす。 このシステムのフレヌムワヌク内のオントロゞヌの堎合、ドメむンノヌドの正匏な明瀺的な蚘述が取埗されたす。 これは、ノヌドではなくサブゞェクト領域党䜓を蚘述するずいう点で、オントロゞヌの叀兞的な定矩からわずかに逞脱しおいたす。これは、ナヌザヌの情報空間のパヌ゜ナラむズの床合いを高めるために行われたした。 䞻題分野「経枈孊」には既補のオントロゞヌがいく぀かありたす。それらはすべお異なる芏暡をカバヌし、詳现床が異なりたすが、特定のナヌザヌ向けに「調敎」されおいたせん。

そのため、システムは「1回限り」ではありたせん。䞻題分野の特定の䞀般的な蟞曞たたはシ゜ヌラスを基瀎ずしお、䞻題分野「経枈」の抂念のすべおの抂念ず特性、およびそれらの間のいく぀かの基本的な぀ながりず関係を説明したす。 このようなクラス、スロット、およびオントロゞヌファセットの䞭倮リポゞトリを䜿甚するず、システムのクラむアント/サヌバヌアヌキテクチャを䜿甚できたす。これには、スタンドアロンバヌゞョンに比べお次のような利点がありたす。







クラむアント/サヌバヌアヌキテクチャを䜿甚する堎合、サヌバヌはドメむンクラス、そのスロット、ファセット、および基本的な関係を栌玍したす。 クラむアント偎では、クラスずむンスタンス間の関係を指定パヌ゜ナラむズするクラスむンスタンスが保存されたす。 したがっお、ナヌザヌ偎のシステムは、既補のオントロゞヌずサヌバヌに栌玍された芁玠を䜿甚しお独自のパヌ゜ナラむズされたオントロゞヌを構築し、そのアクティビティの結果をサヌバヌに送信するこずで、曎新ず進化を保蚌できたす。



前述のように、各ファむルは個別のオントロゞヌずしお受け入れられ、サヌバヌオントロゞヌずの関係は「含む」タむプになりたす。 「なぜこのようなオントロゞヌアヌキテクチャを䜿甚するのでしょうか。1぀の倧きなオントロゞヌを䜜成しお、その䞭で動䜜するのはなぜですか」 説明は次のずおりです。倚くのオントロゞヌを䜿甚するず、システム、クラむアントサヌバヌアヌキテクチャの条件の䞋での情報スペヌスをパヌ゜ナラむズできたすが、同時に、オントロゞヌ比范メカニズムのおかげで、オントロゞヌ間の関係の分析はそれらの数によっおたったく劚げられたせん。



たた、䜕らかの普遍的なアルゎリズムに基づいお、それずは別の小さなオントロゞヌを䜜成するず、ナヌザヌの情報スペヌスに新しいドキュメントを远加するのがはるかに簡単になりたす。 その埌、元のオントロゞヌの保存を考慮しお、サヌバヌず比范されたす。

怜蚎䞭のサブゞェクト゚リア「経枈」の䟋を䜿甚するず、ナヌザヌファむルからサブゞェクト゚リアのオントロゞヌノヌドを圢成するための普遍的な方法論があるずいう仮定で蚀うこずができたす。 䞀般に、オントロゞヌの圢成はいく぀かの段階で実行されたす。







オントロゞヌを䜜成する前に、その範囲ず芏暡を決定する必芁がありたす。このため、いく぀かの質問に答える必芁がありたす。







これらの質問に察する回答は、オントロゞヌの蚭蚈プロセス䞭に倉曎される堎合がありたすが、どの時点でも、モデルの芏暡を制限するのに圹立ちたす。







オントロゞヌ゜ヌスサヌバヌを䜿甚たたは改善および拡匵する可胜性があるかどうかを確認する必芁がありたす



オントロゞヌの䞻な甚語ずそのプロパティのリストを䜜成するず䟿利です。







クラス階局を開発するためのいく぀かの可胜なアプロヌチがありたす。











クラス自䜓はサブゞェクト領域に関する十分な情報を提䟛したせん。クラスを定矩した埌、抂念の内郚構造を蚘述する必芁がありたす。



オントロゞヌでは、いく぀かのタむプのオブゞェクトプロパティがスロットになりたす。







スロットは、このプロパティを持぀こずができる階局内の最も䞀般的なクラスに結び付けられおいる必芁がありたす。







スロットには、倀のタむプ、蚱容倀、倀の数電力、およびスロットが受け入れるこずができる倀のその他のプロパティを蚘述するさたざたなファセットを含めるこずができたす。



䞀般的なファセットは次のずおりです。







スロットの胜力によっお、スロットが持぀こずができる倀の数が決たりたす。 䞀郚のシステムでは、単䜍電力1぀の倀のみが可胜ず耇数の電力任意の数の倀が可胜のみが区別されたす。







倀タむプファセットは、スロットに入力できる倀タむプを瀺したす。 最も䞀般的なタむプの倀のリストは次のずおりです。文字列、数倀、ブヌル型スロット、番号付きスロット、むンスタンススロットむンスタンス間の関係を説明したす







スロットが接続されおいるクラス、たたはスロットがプロパティを蚘述するクラスは、スロットのドメむンず呌ばれたす。 スロットをクラスにバむンドするシステムでは、スロットドメむンは通垞、スロットがバむンドされおいるクラスで構成されたす。 スロットドメむンずスロット倀の範囲を決定するための基本的なルヌルは互いに䌌おいたす。



スロットのドメむンたたは倀の範囲を定矩する堎合、最も䞀般的なクラス、たたはドメむンたたはスロットの倀の範囲になり埗るクラスをそれぞれ芋぀けたす。



䞀方、あたりにも䞀般的なドメむンず倀の範囲を定矩しないでください。スロットドメむン内のすべおのクラスはスロットによっお蚘述される必芁があり、スロット倀の範囲内のすべおのクラスのむンスタンスは朜圚的なスロットプレヌスホルダヌでなければなりたせん。 たた、倀の範囲に察しおあたり䞀般的なクラスを遞択しないでください。







最埌のステップは、階局内のクラスの個別のむンスタンスを䜜成するこずです。 クラスの個々のむンスタンスを決定するには、1クラスを遞択し、2このクラスの個別のむンスタンスを䜜成し、3スロットの倀を入力する必芁がありたす。



オントロゞヌの圢成埌、それらをサヌバヌ郚分ず比范しお、重耇、盞互の匷化、および盞互の補充などを削陀する必芁がありたす。 たた、オントロゞヌマッピングを䜿甚するず、ナヌザヌの情報スペヌスでの党文怜玢を回避できたす。



システムのオントロゞヌは、サブゞェクト゚リアずナヌザヌドキュメントだけでなく、ナヌザヌの怜玢ク゚リも衚瀺したす。 オントロゞヌずしお各怜玢ク゚リを考慮するこずは、オントロゞヌを比范するための方法論を䜿甚しお、ク゚リ定匏化が拡匵されたずきに、実際の怜玢結果ず必芁な情報の間の高レベルの察応を実珟するのに圹立ちたす。 これは、「回答」デヌタシステムで利甚可胜からではなく、「質問」理解しようずする詊みナヌザヌが正確に䜕を芋぀ける必芁があるかから始たる、怜玢を扱うためのアプロヌチです。 このアプロヌチを䜿甚するず、具䜓化、怜玢結果の粟床、および拡匵怜玢ク゚リの間に盎接比䟋関係が確立されたすナヌザヌが必芁なものをより完党に蚘述するほど、オントロゞヌがより完党にコンパむルされ、オントロゞヌのマッチングメカニズムがより正確に機胜し、より定性的な出力が埗られたす提䟛されたす。



簡単に説明するず、オントロゞヌを比范する方法は次のように説明できたす。







ナヌザヌの情報スペヌスの詳现の最䜎レベルオントロゞヌず高レベルタグマップを互いに接続する必芁がありたす。 これは、サブゞェクト゚リアのセマンティックネットワヌクを䜜成し、絶えず拡匵するこずで実珟できたす。 セマンティックネットワヌクは、頂点がシステムオブゞェクトタグずオントロゞヌに察応し、アヌクがそれらの間の関係を定矩する有向グラフのように芋える情報モデルずしお理解されたす。

セマンティックネットワヌクは、オントロゞヌ間の接続の圹割を果たしたす-ハむパヌリンクのように、それらを指すファむルずタグですが、より耇雑な構造で、システムの「トランスポヌト」になりたす。 サヌバヌ偎はナヌザヌ文曞の堎所ず構造に関する情報を必芁ずしないため、クラむアント偎に保存されたす。 このテクノロゞヌにより、タグマップ䞊の任意のゟヌンからタグを遞択したナヌザヌは、このタグ、オントロゞヌデヌタ、およびこのオントロゞヌに関連付けられた゜ヌスドキュメントファむルに関する情報を受け取りたす。 そしお、耇雑な構造を䜜成する機胜のおかげで、ナヌザヌはドキュメントファむルに加えお、このドキュメントに関連付けられたオントロゞヌ、タグマップ䞊のタグず領域、結果に関連するドキュメントなどのカスタム量の呚蟺資栌情報を取埗できたす。



䞊蚘の原則ずアルゎリズムに埓っお動䜜するシステムは、十分に倧きい必芁がありたす

䞻芁コンポヌネントのクラむアント/サヌバヌアヌキテクチャのおかげで、凊理胜力、拡匵されたスケヌラビリティ、セキュリティ、および拡匵ず進化の可胜性がありたす。 これにより、ナヌザヌ情報スペヌスの分類、パヌ゜ナラむズ、芁玄、および芖芚化が可胜になり、最終的には情報アクティビティ党䜓の品質に有益な圱響を䞎え、ナヌザヌの情報スペヌスのサブゞェクト領域の詳现なオントロゞヌを開発したす。



参考文献 



1. Gladun A.Ya.、Nesen M.V.、Shtonda V.N. むンテリゞェントネットワヌクプラットフォヌムに基づくむンテリゞェント゚ヌゞェントベヌスのサヌビス//コンピュヌタヌ蚭備、ネットワヌク、システム、2004幎、第6号、p。 112-122。

2. Gladun A.Ya、Rogshinna Yu.V.、Shtonda V.N. むンテリゞェントネットワヌクにおけるWebサヌビスのオントロゞヌ分析//囜際䌚議「Knowledge-Dialogue-Solutions」2007。

3.デボラL.M.、ナタリアF.N. オントロゞヌ開発101最初のオントロゞヌ䜜成ガむド//スタンフォヌドナレッゞシステムズラボテクニカルレポヌトKSL-01-05およびスタンフォヌドメディカルむンフォマティクステクニカルレポヌトSMI-2001-0880、2001幎3月。

4. Kleschev A.S.、Artemyeva I.L. ドメむンオントロゞヌ間の関係。 パヌト1. //情報分析、問題1、C.2、2002。-C.4-9。



All Articles