オントロジーは何から始まりますか?

同じ初心者、私のようなオントロジー、そして始めたい人、それが何なのか、何を食べ、どこから始めたいのか疑問に思っている人のために、私は始めたところから始めて、私、すなわち:



  1. オントロジーの用語 。記事や講義で使用される用語の意味を理解できるようにします
  2. オントロジー開発の記事101: 2001年の最初のオントロジー作成ガイド 。これは、 オントロジーに携わるすべての人のための基本的な記事であり、 国際フォーラム「教育技術者と社会」のサイトからのロシア語への翻訳です。 この記事の欠点は、ワインに関するオントロジーの非常に良い例ではありません。
  3. レクチャーオントロジーと lektorium.tvからの知識のプレゼンテーションは ここで言及しました 。 私の意見では、これはまさにオントロジーとは何か、なぜ必要なのかを表すために必要なものです。 さらに、講義では、既存のプロジェクト、ツール、アプリケーションなどに関する多くの有用な情報を提供します。




また、入門コースとして、 ロシア語の翻訳からコピーアンドペーストして、このトピックへの関心を高めます。



未知の翻訳者A. Filyaevへの翻訳をありがとう



将来的には、素材をマスターし、新しい知識を獲得しながら、このトピックを続けていきたいです。



オントロジーを作成する理由



近年、オントロジーの開発-ドメイン用語とそれらの間の関係の正式な明示的記述(Gruber 1993)-は、人工知能研究所の世界からドメイン専門家のデスクトップに移行しました。 オントロジーは、World Wide Webで一般的になっています。 オンラインのオントロジーは、Webサイトを分類する大規模な分類(Yahoo!など)から、販売された商品とその特性(Amazon.comなど)の分類にまで及びます。 WWWコンソーシアム(W3C)は、情報を検索する電子エージェントが理解できるようにするために、Webページの知識をコーディングするための言語であるRDF(Resource Description Framework)(Brickley and Guha 1999)を開発しています。 国防高等研究計画局(DARPA)は、W3Cと共同で、DARPAエージェントマークアップ言語(DAML)を開発し、ネットワーク上のエージェントの相互作用を促進するために設計されたより表現力豊かな設計でRDFを拡張しています(Hendler and McGuinness 2000)。 多くの学問分野では、各分野の情報を共有して注釈を付けるために主題専門家が使用できる標準オントロジーが開発されています。 たとえば、医療分野では、snomed(Price and Spackman 2000)やUnified Medical Language System(Humphreys and Lindberg 1993)のセマンティックネットワークなど、大規模で構造化された辞書が作成されています。 広範な汎用オントロジーも表示されます。 たとえば、国連開発プログラムとダン&ブラッドストリートは、商品やサービスの用語を提供するUNSPSCオントロジーを開発するために協力しています(http://www.unspsc.org/)。



オントロジーは、主題分野で情報を共有する必要がある科学者のための共通の語彙を定義します。 サブジェクト領域の基本概念とそれらの関係の機械解釈された定式化が含まれています。



オントロジーを開発する必要があるのはなぜですか? いくつかの理由があります。

情報の構造に関する共通の理解を人々またはソフトウェアエージェントが共有するため。



情報の構造に関する共通の理解を人やソフトウェアエージェントが共有することは、オントロジーを開発する上で最も一般的な目標の1つです(Musen 1992; Gruber 1993)。 たとえば、いくつかの異なるWebサイトに医学に関する情報を含めたり、インターネット経由で支払われた有料医療サービスに関する情報を提供したりします。 これらのWebサイトがすべて使用する用語の同じ基本オントロジーを共有および公開している場合、コンピューターエージェントはこれらのさまざまなWebサイトから情報を抽出して蓄積できます。 エージェントは、蓄積された情報を使用して、ユーザーの要求に応答するか、他のアプリケーションへの入力として使用できます。

ドメイン知識の使用を可能にすることは、オントロジーの研究における最近の急増の原動力の1つになりました。 たとえば、さまざまなサブジェクト領域のモデルの場合、時間の概念を定式化する必要があります。 この表現には、時間間隔、時点、時間の相対的な尺度などの概念が含まれます。 科学者のグループの1つがこのようなオントロジーを詳細に開発した場合、他のグループはそれを対象分野で単純に再利用できます。 さらに、大規模なオントロジーを作成する必要がある場合、大規模な主題領域の一部を記述する複数の既存のオントロジーを統合できます。 UNSPSCなどの基本的なオントロジーを再利用し、対象分野を説明するために拡張することもできます。



実装の基礎となるサブジェクト領域に明示的な仮定を作成すると、サブジェクト領域の知識を変更するときにこれらの仮定を簡単に変更できます。 プログラミング言語で世界に関する仮定をハードコーディングすると、これらの仮定を見つけて理解するのが難しくなるだけでなく、特にプログラマでない人にとっては変更が難しくなるという事実につながります。 さらに、明示的なドメイン知識の仕様は、ドメイン用語の意味を知る必要がある新規ユーザーに役立ちます。



オントロジーを一般的に使用するためのもう1つの選択肢は、ドメイン知識と運用知識を分離することです。 必要な仕様に従ってコンポーネントから製品を構成するタスクを説明し、この構成を製品およびコンポーネント自体から独立させるプログラムを実装できます(McGuinness and Wright 1998)。 その後、コンピューターのコンポーネントと特性のオントロジーを開発し、このアルゴリズムを適用して非標準コンピューターを構成できます。 エレベータコンポーネントのオントロジーを提供する場合、同じアルゴリズムを使用してエレベータを構成することもできます(Rothenfluh et al。1996)。



用語の宣言的仕様がある場合、主題分野の知識の分析が可能です。 用語の正式な分析は、既存のオントロジーを再利用しようとする場合と、それらを拡張する場合の両方で非常に貴重です(McGuinness et al。2000)。



多くの場合、サブジェクト領域のオントロジーはそれ自体が目標ではありません。 オントロジーの開発は、他のプログラムで使用するデータセットとその構造を定義することに似ています。 問題解決方法、ドメインに依存しないアプリケーション、およびソフトウェアエージェントは、これらのオントロジーに基づいて構築されたオントロジーと知識ベースをデータとして使用します。 たとえば、この記事では、ワインと料理のオントロジー、およびワインと料理の適切な組み合わせを開発します。 次に、このオントロジーは、レストランを管理するためのツールキットのアプリケーションの基礎として使用できます。あるアプリケーションでは、当日のメニューのワインのリストを作成したり、ウェイターや訪問者からのリクエストに応答したりできます。 別のアプリケーションでは、ワインセラーの在庫を分析し、次のメニューまたは料理の本に購入するために特定のワインを補充するためのワインのカテゴリーを提供できます。



All Articles