主な誤解は、 「Googleマップはインターネット上の企業に関する情報を見つける」というものです。 これは完全に真実ではありません。 あなたの会社に関する情報は、インデックス化された何百ものウェブページに掲載されている場合がありますが、Googleマップの発行に含まれていない場合があります。
キャッシュされたWebページのインデックスで検索するWeb検索とは異なり、Googleマップには企業の構造化ディレクトリが含まれています。 各エンタープライズレコードには、マシンが理解できるデータを含むキー値フィールドが含まれています。 これにより、 「キエフスキー駅から半径10 km以内でベジタリアンメニューと予約注文のレストラン」を見つけることができますが、多くの場合、カタログには住所と電話番号についてのみ正確な値が含まれています。
したがって、Googleが独自のディレクトリで検索する方法ではなく、情報がどこから来たかが重要です。
Google Mapsディレクトリのデータはどこから来たのですか?
Googleによると、カタログは「さまざまなソースからの情報を組み合わせて、最高の結果を生み出します」。 ソースは2つのグループに分けられます。
構造化および半構造化は、プログラムが理解できるKey-Valueプログラムに簡単に取り込むことができるデータソースです。 これは通常です:
- 購入される企業の商業基盤
- 大企業のディレクトリを含むWebサイト 。 これらのサイトからのデータは、正規表現を使用してカタログページから情報を抽出する個々のクローラーによって取得されます
- ビジネスオーナーが自分で情報を入力するGoogleローカルビジネスセンター
- Google Maps APIを使用してポイントを表示するために使用されるKML(および同様の)ファイル
- カスタムカード
非構造化 -これらはインデックス化されたWebサイトで、会社に関する情報が含まれている場合がありますが、それらのデータは構造化できません。
情報の構造化方法
このプロセスは、3つの主要なステップで説明できます。
- Key-Valueデータは、いくつかの構造化されたソースから取得されます。
- 企業に関するデータはクラスター化されます。異なるソースからの値が比較され、それぞれの精度と重みが決定されます。
- 構造化データは非構造化*によって補完されます
*
構造化データには、通常、企業に関する正確ではあるが希少な情報が含まれています。 そして、これは難しくなります:
したがって、企業のメインフィールド(名前、住所、電話番号)が定義されている場合、リクエストに応じてWeb検索が実行されます。
- 検索 ; 企業のカタログに所有形態のフィールドが含まれていない場合、「私立幼稚園」を見つける方法
- ランキング すべてのデータが同じディレクトリからのものである場合、どの「薬局」が最初に発行されるべきかを判断する方法は?
_+_
見つかったページ(および最も重要なことには、見つかったページのキーワード)は会社のデータに関連付けられています。
動作しない方法
アルゴリズムが誤った結果をもたらす場合、いくつかの例を挙げることができます。
「ホステル」を探しており、アメリカの領事部を見つけます
理由 :ホステル協会のウェブサイトは常に大使館と領事館のリストをホストしています。 領事事務所は、構造化されたソースの1つからカタログに含まれていましたが、hihostels.com.uaサイトに関連付けられていました
私たちは「賃貸マンション」を探しており、住宅オフィスを探しています
理由:不動産レンタルサイトはユーティリティのリストをホストしています。 ZHEKは、エンタープライズデータベースの1つからGoogleディレクトリに入りましたが、toprealty.org.uaに関連付けられていました
Googleマップの発行で会社を取得するために何をすべきか
会社に関する情報がどれだけウェブに含まれていても、最も重要なことは、この情報が1つ(できれば複数の)構造化されたソースに分類されることです。 問題は、Googleが情報の取得元のデータベースとディレクトリをリストしていないことです。 唯一知られている場所はGoogle LBCです。
合計
Googleマップは、Google Web検索ほど透明ではありません。
- ほとんどのユーザーは、Googleマップの検索方法を認識していません
- 多くの場合、情報源を特定することは不可能です
- 結果が「少なくとも驚き」の原則に準拠していない場合があります
Googleはもっと良くできたと思う。
訂正、追加、コメントに感謝します。
ソース
構造化情報の生成(特許出願US 2006/0200478 A1)
Googleのローカル検索特許出願(SEOバイザシー)
ローカルリスティング:どこから来たのですか?