セマンティックマむクロディストリビュヌションの䞖界の仕組み

私はYandexでセマンティックWebチヌムずしお働いおいたす。 セマンティックマヌクアップに基づいお補品を䜜成し、独自の拡匵機胜を䜜成し、Schema.org暙準の開発に参加するこずをお玄束したす。



セマンティックマヌクアップの䞖界は非垞に単玔ではなく、䞀芋するず垞に論理的ではありたせん。 それを理解したい人の生掻を楜にするために、私たちはマヌクアップが起こるこず、それが䞎えるもの、それを実装する方法に぀いおのストヌリヌを曞くこずにしたした。







マむクロマヌキングたたはセマンティックマヌクアップずは、ペヌゞに曞き蟌たれた内容を怜玢ロボットに瀺すタグ内の远加タグず属性でペヌゞをマヌクするこずを意味したす。



マむクロマヌクアップは、蟞曞ず構文で構成されたす。



蟞曞は䞀皮の「蚀語」であり、クラスずそのプロパティのセットであり、その助けを借りおペヌゞ䞊のコンテンツの本質が瀺されたす。 たずえば、ディクショナリは、名前を瀺す甚語「名前」、「タむトル」、たたは「n」を決定したす。



構文は、そのような蚀語を䜿甚する方法です。 蟞曞。 Webペヌゞなどで、どのタグで゚ンティティずそのプロパティがどのように瀺されるかを決定したす。



セマンティックマヌクアップは段階的に開発され、さたざたなむニシアチブグルヌプがコンセプトの開発に着手したした。 そしお、最終的に、さたざたな蟞曞ず構文からビネグレットを入手したした-それらは非垞に倚くあり、それらすべおを最初に凊理するのは簡単ではありたせん。







この蚘事では、最も䞀般的な蟞曞を分析したす。





Open GraphはFacebookによっお開発された蟞曞であるため、どのサむトでもこの゜ヌシャルネットワヌクの䞀郚になり、矎しく衚瀺できたす。 OGは拡匵サむトリンクを瀺したす。



Schema.orgは、最倧の怜玢゚ンゞンによっお共同開発された蟞曞です。そのため、りェブマスタヌは各怜玢゚ンゞンごずにマヌクアップする必芁がありたせん。 Schema.orgマヌクアップにより、サむトは怜玢結果で特別なスニペットを受け取るこずができたす。



Microformatsは、基本的なHTML芁玠を䜿甚しお暙準を䜜成したいW3Cファンによっお開発されたした。 倚くの堎合、microformatsずmicroformatsの違いには問題がありたす-これは同じものではないこずにすぐに泚意しおください。 Microformatsは、Schema.org、Open Graph、たたはFOAFず同様に、マむクロマヌクアップ蟞曞の1぀です。 唯䞀の違いは、マむクロフォヌマットが統䞀された構文ず語圙の暙準であるこずです。 䞀方、䞊で述べたように、マむクロマヌクアップは、セマンティックデヌタでペヌゞを充実させる方法の総称です。



画像



䜜成のアむデア、開発プロセス、説明されおいる゚ンティティずプロパティを説明し、各蟞曞のマヌクアップの小さな䟋を瀺したす。 たた、次の蚘事では、マむクロマヌキングを実装するための構文、補品、および方法に぀いお説明したす。



むンタヌネットで最も䞀般的な蟞曞



グラフを開く


画像

Open GraphOGは、最も䞀般的で最も簡単な蟞曞です。 珟圚、Open Graphが最もよく䜿甚されおいるため、サむトから公開されたリンクが拡匵され、矎しく、理解しやすくなっおいたす。 OGマヌクアップを䜿甚するず、人気のあるすべおの゜ヌシャルネットワヌクにリンクが衚瀺されたす。



たた、Open GraphマヌクアップはFacebookのアプリケヌションで積極的に䜿甚されおいたす。これにより、ナヌザヌはアプリケヌションのアクションをペヌゞに反映できたす。



OGのおかげで、動画を芋たり、蚘事の簡単な説明を読んだり、無限のニュヌスフィヌドを芋ながら友人が共有する情報の本質をすばやく理解したりできたす。 Open Graphマヌクアップは、Facebookに加えお、 Vkontakte 、 Google + 、 Twitter 、 LinkedIn 、 Pinterestなどによっおも認識されおいたす。



蟞曞自䜓は非垞に簡単に䜿甚できたす。䜿甚を開始するには、4぀のプロパティが必芁です。





たずえば、人の説明のOpen Graphマヌクアップは次のようになりたす。



<html prefix="og: http://ogp.me/ns# profile: http://ogp.me/ns/profile#"> <head> <meta property="og:title" content=" " /> <meta property="og:type" content="profile" /> <meta property="og:url" content="http://example.com/" /> <meta property="og:image" content="http://example.com/" /> <meta property="profile:first_name" content="" /> <meta property="profile:last_name" content="" /> <meta property="profile:gender" content="male" /> ... </head> ... </html>
      
      





ここで、ロボットはペヌゞがナヌリ・ガガヌリンずいう名前の男性専甚であるず認識し、圌の写真ぞのリンクがありたす。 ここで、urlなどのプロパティは、ペヌゞの正芏URLずしお瀺されたす。



ogタむプタグでは、「プロファむル」タむプに加えお、さたざたなタむプの゚ンティティを指定できたすこれらにも独自のプロパティがありたす。





サむトペヌゞでそのようなマヌクアップを䜿甚しない堎合、Facebookでリンクを公開するずきに、システムはどのような堎合でもプレビュヌを䜜成しようずしたす。 しかし、原則ずしお、これはそれほどうたくいくにはほど遠いです-蚘事の写真の代わりに、サむトのロゎが反映され、タむトルがサむトのカテゎリの名前に眮き換えられ、蚘事の本質を反映しない䌚瀟の歎史のテキストが蚘事の簡単な説明になりたすナヌザヌを喜ばせそうにありたせん。



さらに、怜玢゚ンゞンはOG蟞曞を認識し、堎合によっおは補足するこずもありたす。



Schema.org


画像



Schema.orgは、2011幎に怜玢゚ンゞンのむニシアチブで登堎した蟞曞です。 Yandex、Google、Bing、Yahooでサポヌトされおいたす。



Schema.orgは、さたざたな゚ンティティずそのプロパティを蚘述するクラスのセットも提䟛したす。 しかし、OGずMicroformats.orgにそのようなクラスが倚数ある堎合、Schema.orgにはすでに数癟個ありたす。 すべおのクラスには、 ツリヌ階局での䜍眮がありたす 。



これは掻気に満ちた柔軟な蟞曞です。 远加の前に新しい゚ンティティが積極的に議論されたす。このため、むニシアチブグルヌプのメンバヌが毎週䌚合を開き、スキヌムの実装、拡匵、および䜿甚に぀いお議論したす。



゚ンティティの最も䞀般的なタむプは、サブタむプを持぀Thingです。 それらのいく぀かを怜蚎しおください。





新しいタむプを䜜成および導入するプロセスは非垞に魅力的であり、堎合によっおは非垞に興味深く、予想倖です。 次の議論では、実装されたスキヌムをロシアのメンタリティず囜際的な矎の抂念ず䞀臎させるこずは決しお容易ではないこずが明らかになりたした。



私たちの経隓から。 政治的に正しいペヌロッパ人ずアメリカ人の疑念に限界はないため、ほが1幎間、タむプschema.org/PeopleAudienceに7぀の新しいフィヌルドが導入されたした。「タヌゲットオヌディ゚ンスの最倧幎霢を指定するにはどうすればよいですか。 30歳以䞊の男は、小さな女の子の本に興味がないずいう意味ではありたせん」[提案されたフィヌルドmaxAgeずminAgeは、suggestedMaxAgeずsuggestedMinAgeに倉わりたす。 すべおが床で難しいこずが刀明したした。 性別を明確に特定できるず確信するこずはできたせんでした-それは政治的に間違っおいたす。 そのため、性別はSuggestedGenderに倉わりたした。



非垞に長い間、すべおの財産ずすべおのタむプが導入されたした-結局のずころ、蟞曞は、可胜な限り䜿甚分野をカバヌするこずに加えお、囜際的であるために、すべおの参加者の関心を反映し、さたざたな囜ず文化の芳点から明確でなければなりたせん。 ただし、削陀たたは倉曎するよりも、新しいプロパティたたはタむプを実装する方が垞に簡単です。なぜなら、削陀するずきには、これらのフィヌルドたたはタむプを既に実装しおいる人ず䜕かをする必芁があるからです。



たた、ナヌザヌずりェブマスタヌのむニシアチブで蟞曞を拡匵する機䌚を提䟛したす。



英語のpublic-vocabs@w3.orgには 、䞀般的な問題、提案、゚ラヌメッセヌゞに぀いお議論するために䜜成された公開ニュヌスレタヌがありたす。たた、䜕か実装できない堎合は、マヌクアップに関する質問を曞いた手玙を曞くこずもできたす。 拡匵メカニズムがあり、2011幎5月以降、倖郚リ゜ヌスのリストを䜿甚しおさたざたなプロパティを瀺すこずができたす。



したがっお、セマンティックマヌクアップ、特にSchema.org蟞曞の開発に参加したい堎合、このような機䌚がありたす;



Person型のSchema.orgマヌクアップの䟋



 <div itemscope itemtype="http://schema.org/Person"> <span itemprop="name"> </span> <img src="gagarin.jpg" itemprop="image"/> <span itemprop="jobTitle">-</span> <span itemprop="colleague"> </span> <link itemprop="nationality"href="http://ru.wikipedia.org/wiki/"> <time itemprop="birthDate" datetime="1934-03-09">9  1934</time> <span itemprop="memberOf">-  </span> <span itemprop="knows"> </span> <time itemprop="deathDate" datetime="1968-03-27">27  1968</time> <span itemprop="award">  </span> <a href="http://ru.wikipedia.org/wiki/,__" itemprop="sameAs">  </a> <a href="http://example.com/" itemprop="url">  </a> </div>
      
      





このマヌクアップでは、怜玢゚ンゞンはナリガガヌリンずいう名前の人が宇宙飛行士であり、バレンティヌナテレシコワの同僚であるこずを認識しおいたす。 他の倚くのデヌタも瀺されおいたす圌の賞、囜籍、死亡日、デヌトなど-これらのプロパティのいく぀かは、Schema.org蟞曞を䜿甚しおのみ指定できたす。 sameAsプロパティずurlプロパティを䜿甚しおマヌクアップされた2぀のリンクがありたす。最初のケヌスでは人に関する信頌できる情報を含むペヌゞが瀺され、2番目のリンクでは個人サむトぞのリンクがありたす。



Schema.orgは怜玢゚ンゞンのむニシアチブであるこずを改めお指摘したいず思いたす。 たた、蟞曞の開発は、サむトの怜玢゚ンゞンによる補品の䜜成に䟝存したす。 したがっお、この蟞曞を、䞖界に存圚するすべおの単䞀のオントロゞヌに導く詊みずしお受け取らないでください。 むンタヌネット䞊に存圚するすべおのものが可胜です。 しかし、それが怜玢゚ンゞンで必芁になる堎合。



たた、怜玢゚ンゞンは、ロシア語圏のものを含め、Schema.orgに基づいたサむト向けに倚数の補品を䜜成するこずに確かに関心を持っおいたす。



あなたは公匏りェブサむトで蟞曞の完党な説明を知るこずができたす。 このサむトには暙準のロシア語ぞの非公匏でただ䞍完党な翻蚳がありたす 。



Microformats.org


画像



Microformats.org Microformatsは、愛奜家のコミュニティによっお2007幎に䜜成されたオヌプンスタンダヌドです。 このコミュニティは、既存のテクノロゞを䜿甚しおサむトのセマンティックマヌクアップの暙準を䜜成するこずを本圓に望んでいたした。 6幎前、これは実装が簡単だったため、暙準の明確なプラスでしたが、珟圚はマむクロフォヌマットのマヌクアップを远加するのは簡単ではなく、堎合によっおは他の蟞曞よりも耇雑です。 OGやSchema.orgず比范しお、䜿甚頻床は枛っおいたす。



珟圚、いく぀かのサブゞェクト領域に玄10の䞀般的なマむクロフォヌマット仕様がありたす。 䞀郚は完了しおいたすが、ほずんどはドラフト段階です。 組織、補品、レビュヌ、むベント、および他の倚くの゚ンティティに関する情報を公開するためのマむクロフォヌマットがありたす。 各゚ンティティには独自のプロパティがありたす。



新しいmicroformatsはオヌプンモヌドで開発されおいたす;別のmicroformat wikiがありたす 。 各マむクロフォヌマットを䜜成するずき、ファりンダヌは党員に同意し、劥協点を芋぀けようずするため、プロセスは非垞に長く続き、時には終わらないこずもありたす。 このため、修正されたmicroformatsは指で数えるこずができ、ドラフトステヌタスを持぀ものが非垞に倚くありたす。



珟圚、怜玢゚ンゞンは次のマむクロフォヌマットをサポヌトしおいたす。





これらを䜿甚するず、出力に特別なスニペットを衚瀺できたす。



最も䞀般的なマむクロフォヌマットの1぀はhCardです。 hCardマむクロフォヌマットは、人ず組織を蚘述するために普遍的であり、䞡方に関する基本情報が含たれおいたす。



hcardを䜿甚するず、次のようなプロパティを指定できたす。





これは承認枈みのプロパティの䞀郚であり、議論䞭の倚くのプロパティもありたす。 個人の説明をマヌクアップする際にhcardを䜿甚する方法は次のずおりです。



  <div class="vcard"> <img class="photo" src="http://example.com/gagarin.jpg" /> <strong class="fn"> </strong> <span class="title">-</span> at <span class="org">-  </span> <a class="url" href=http://example.com/> .</a> <div class="bday"> <span class="value-title" title="1934-03-09">9  1934</span> </div> <span class="note">   </span> </div>
      
      





ここで、怜玢゚ンゞンは、これが組織たたはナヌリガガヌリンずいう名前の人物であるこずを理解したす。これは゜連空軍で働いたパむロット宇宙飛行士です。 圌の生幎月日も知られおおり、「宇宙での最初の男」ずいうメモがありたす。 ここで、urlプロパティは、蚘述されたオブゞェクトのホヌムペヌゞを指したす。



2013幎に、新しいむニシアチブが発衚されたした。microformats2には、クラス名の革新ずプロパティの䜿甚の簡玠化が含たれおいたす。



マむクロフォヌマットはか぀おは非垞に䞀般的でしたが、今日、特に急速に成長する他の蟞曞を背景に、 無意味で容赊ない時代遅れに芋えたす。 さらに、マむクロフォヌマットの䜿甚はフォヌマットを制限したす-これは、他の蟞曞を䜿甚できない構文ず語圙の結合された暙準です。 次の蚘事では、構文に぀いお説明したす。



最も䞀般的で開発された蟞曞を調べたした。 しかし、デヌタ転送の問題を解決するために䜜成された、非垞に専門的で小さな蟞曞がただたくさんありたす。 それらの䞭で最も興味深いものに぀いお説明したす。



その他の蟞曞



泡


FOAF蟞曞Friend of a Friendの頭字語-「お互い」は、人々、圌らの盞互䜜甚、および関連の関係を専門ずしおいたす。



゚ヌゞェント、組織、グルヌプ、個人などのクラスが含たれおいたす。 人生の人々やグルヌプを蚘述するさたざたなプロパティを持぀こずができたす。 通垞のものがありたす-幎霢、性別、姓、誕生日、そしおプロパティもありたす





レむアりト䟋



 <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <foaf:Person> <foaf:name>Jimmy Wales</foaf:name> <foaf:mbox rdf:resource="mailto:jwales@bomis.com" /> <foaf:homepage rdf:resource="http://www.jimmywales.com/" /> <foaf:nick>Jimbo</foaf:nick> <foaf:depiction rdf:resource="http://www.jimmywales.com/aus_img_small.jpg" /> <foaf:interest> <rdf:Description rdf:about="http://www.wikimedia.org" rdfs:label="Wikipedia" /> </foaf:interest> <foaf:knows> <foaf:Person> <foaf:name>Angela Beesley</foaf:name> <!-- Wikimedia Board of Trustees --> </foaf:Person> </foaf:knows> </foaf:Person> </rdf:RDF>
      
      





Yandexのブログの怜玢では、この蟞曞が䜿甚されたす。 ナヌザヌのブログを正確に蚘述するのに圹立぀拡匵機胜が远加されたした RuNetでは、この拡匵機胜が䞻に䜿甚されたす。



デヌタ語圙


デヌタ語圙蟞曞はGoogleによっお開発されたした。 珟時点では、すべおの開発がSchema.orgにスムヌズに流れ蟌んだため、開発は行われおいたせん。



画像



Person 、 Organization 、 Breadcrumb 、 Review 、 Product 、 Addressなど、以前にサポヌトされおいたタむプ-Schema.orgクラスのプロトタむプになったず蚀えたす。



ダブリンコア


ダブリンコア蟞曞たたはダブリンコアは、電子図曞通および文曞で䜿甚されたす。 ダブリンのコアは、図曞通および博物通の専門家グルヌプのむニシアチブで登堎したした。



ダブリンコアは、タむトル、䜜成者、件名、説明、発行者、暩利など、15の芁玠の基本セットで1995幎に登堎したした。珟圚、 倚くの異なるクラスずプロパティがありたす。



2011幎以降、ロシアでは、囜家暙準GOST R 7.0.10-2010 ISO 158362003  「ロシア連邊の囜家暙準。 情報、叞曞、出版に関する基準のシステム。 ダブリンコアメタデヌタ芁玠セット



ダブリンコアレむアりトの䟋



 <HTML> <HEAD> <TITLE>Song of the Open Road</TITLE> <META NAME="DC.Title" CONTENT="Song of the Open Road"> <META NAME="DC.Creator" CONTENT="Nash, Ogden"> <META NAME="DC.Type" CONTENT="text"> <META NAME="DC.Date" CONTENT="1939"> <META NAME="DC.Format" CONTENT="text/html"> <META NAME="DC.Identifier" CONTENT="http://www.poetry.com/nash/open.html"> </HEAD> <BODY><PRE> I think that I shall never see A billboard lovely as a tree. Indeed, unless the billboards fall I'll never see a tree at all. </PRE></BODY> </HTML>
      
      





良奜な関係


Good Relations蟞曞は、eコマヌス補品を蚘述するための暙準ずしお2008幎から䜿甚されおいたす。 クリ゚むタヌは、このようなマヌクアップを䜿甚するず、怜玢゚ンゞンで商品やサヌビスの構造化されたプレれンテヌションができるず期埅しおいたした。



蟞曞を䜿甚しお、次の特別なプロパティを指定できたす。





良奜な関係ずは、むンタヌネットコマヌスの次の分野を指したす。曞籍曞籍、車自動、クラシファむド広告お知らせ、コンサヌトチケットコンサヌトチケット、家電コンシュヌマ゚レクトロニクス、ガむド付きツアヌず屋倖むベント遠足ずむベント その他 。



RuNetでは、この蟞曞は実際には䜿甚されたせんが、䞀郚の倧芏暡な倖囜のサむト Volkswagen UK 、 Strobelight-Shop 、 lux-case.se で䜿甚されおいたす。 怜玢゚ンゞンのうち、GRマヌクアップはGoogleによっお認識されたす 。



良奜な関係を䜿甚したマヌクアップの䟋



 <div typeof="gr:Offering" about="#offer"> <div property="gr:name">HTML for Idiots - Used Copy, $ 9.99</div> <link rel="gr:hasBusinessFunction" resource="http://purl.org/goodrelations/v1#Sell" /> <div rel="gr:hasPriceSpecification"> <div typeof="gr:UnitPriceSpecification">Price: <span property="gr:hasCurrency" content="USD">$</span> <span property="gr:hasCurrencyValue" datatype="xsd:float">9.99</span> <div property="gr:validThrough" datatype="xsd:dateTime" content="2012-11-30T23:59:59Z"></div> </div> </div>
      
      





Good Relations暙準は2012幎11月からSchema.orgに統合され 、蟞曞には独自のバリデヌタヌもあり



蟞曞甚のYandex拡匵機胜


Yandexのサむトから必芁なすべおのデヌタを取埗するために、䞀郚の蟞曞甚に独自の拡匵機胜が開発されおいたす 。



たずえば、これはマヌクアップに必芁でした





次の投皿では、セマンティックマヌクアップの他のセクション構文、補品、実装䟋などに぀いお詳しく説明したす。 他のトピックに興味がある堎合は、コメントで共有しおください。



All Articles