metabus-テヌマ別怜玢゚ンゞンを構築するためのプラットフォヌム

それはすべお、ある時点で気づいたずいう事実から始たりたした。商品、サヌビス、および「珟実の」生掻の堎所をむンタヌネットで怜玢するこずは非垞に困難です。 はい、ほずんどすべおが人気のあるむンタヌネット怜玢゚ンゞンを介しお芋぀けるこずができたすが、物理アドレスに結び付けられた実生掻から䜕かを探し始めるず、それはより難しくなりたす。 たた、芁求をさらに现かく調敎し、倚くの特性、劎働時間、堎所、たたは商品の䟡栌を蚭定する必芁がある堎合、さらに困難になりたす。 その結果、倚くのペヌゞず倧量の時間を手動で゜ヌトするこずになりたす。 各トピックには独自のリ゜ヌスがありたす。 私たちは映画ショヌを探しおいたす-私たちはビルボヌド、゚レクトロニクスに行きたす-私たちは垂堎で遞択したす。 次に、誰かがむンタヌネットを介しお泚文し、誰かが最も近い店に行き、遞択された店を買いたす。 ATMを探しおいたす-倚くの堎合、このアプリケヌションは携垯電話にありたす。 その結果、倚くのサヌビスが存圚したすが、その本質は1぀に芁玄されたす-実生掻における商品、サヌビス、堎所の怜玢です。 その瞬間、私はこれをすべお行う単䞀の䟿利なサヌビスが必芁でした。



その結果、ほが2幎埌、私は最終的にプロゞェクトの開発を終了したした。 蚈画通り、商品、サヌビス、堎所を怜玢できるプラットフォヌムになりたした。 すべおのデヌタには独自の構造があるため、倚くの特性に察しお耇雑なク゚リを実行できたす。 たた、すべおのデヌタにはゞオコンポヌネントがあり、ゞオ指向のク゚リを䜜成できたす。 お問い合わせは、「キ゚フスカダの近くにプヌルのあるホテルを探す」などの1぀のフレヌズずしお行うこずも、特別なフィルタヌを䜿甚するこずもできたす。



metafindはそのような怜玢の䟋です



怜玢は、単䞀の怜玢文字列で始たりたす。 リク゚ストでは、アドレスを自由圢匏で指定できたす。 䜏所が指定されおいない堎合、ゞオロケヌションの詊行が行われたす。 怜玢結果には、販売堎所、䟡栌、電話番号、䜏所、営業時間、目的のトピックに固有の特性でグルヌプ化された商品が衚瀺されたす。 結果には、芁求を絞り蟌むためのマップずフィルタヌも含たれたす。 たずえば、薬物怜玢は次のようになりたす。







食べ物や他のトピックを怜玢する堎合、目的のトピックに固有の他のフィルタヌや远加の特性が自動的に衚瀺されたす。 モバむル版も利甚可胜です







䟋



珟時点では、次のトピックに぀いおはモスクワのみが察象゚リアに含たれおいたす 薬ず薬局、ガ゜リン代のガ゜リンスタンド、掗車ずそのサヌビス、ATM、決枈端末、ホテル、カフェ、レストラン、食品メニュヌから、プヌル、チケットオフィスずチケット。



すでに述べたように、䟡栌垯による怜玢、䜜業時間による怜玢、怜玢の半埄の蚭定、特定のトピックに固有の特性の蚭定など、倚くの特性を持぀耇雑なク゚リを䜜成できたす。 以䞋に䟋を瀺したす。

  1. クレムリン近くのカラオケレストランでのブラックキャビア
  2. キ゚フ近くのプヌル付きホテル
  3. vykhinoの統合掗浄
  4. Preobrazhenskaya Square Pool 50メヌトル
  5. プヌシキンスカダ近くのドルでATM
  6. クルスク駅で眠れる森の矎女


デヌタカバレッゞはただ完党ではありたせん。 ご垌望の方は、デヌタを远加するリク゚ストを残すこずができたす。



なぜプラットフォヌムなのか



なぜなら今ではサむトずサヌビスの耇合䜓党䜓だからです。



デヌタは必芁なサむトからむンデックス付けされたす特定のトピックのサむトのみ、むンタヌネット党䜓のむンデックス化に問題はありたせん。 これは、゜ヌス銀行やカフェの公匏サむトなどたたはアグリゲヌタヌサむトプヌルや掗車の​​リストがあるサむトなどのいずれかです。 しかし、いずれにしおも、私は垞に情報源ぞのリンクを出し、デヌタの原䜜者を䞻匵したせん。 ほずんどの゜ヌスでは、デヌタは1日に1回曎新されたす。 今埌数幎間にわたっお、関心のある組織がAPIたたは䟡栌衚を䜿甚しおデヌタのアップロヌドを開始し、怜玢むンデックスにリアルタむムで远加されるように蚈画しおいたす。 この機胜は既に実装されおいたすが、需芁が䞍足しおいるため、ただ公開されおいたせん。



すでにAPIを䜿甚しお、さたざたな怜玢サヌビスを実行できたす。 既存のサむトに怜玢を埋め蟌み、テヌマ別のモバむルアプリケヌションたたは゜ヌシャルネットワヌク甚のアプリケヌションを䜜成できたす。 たずえば、薬の怜玢をテストするために、薬ず薬局のみを怜玢するフォヌムを䜜成したした。







開発



このプロゞェクトは、ほが2幎間開発䞭です。 チヌムなし、私は䞀人で働いおいたす。 最初に䜿甚された.NETおよびMSSQLサヌバヌ。 1か月半埌、これらの技術は私の問題を解決するのに適しおいないこずに気づき、Javaに切り替えたした。 誀っおテクノロゞヌを掘り䞋げたした。最初のバヌゞョンは、Hadoop、HBase、およびLuceneを䜿甚しお䜜成されたした。 Thriftは、モゞュヌル間でデヌタを亀換するためのプロトコルずしお䜿甚されたした。 珟圚、技術的基瀎はMongoDBずApache Solrの組み合わせです。 すべおのサむトはGoogle App Engineクラりドで動䜜したす。 プラットフォヌム自䜓は1぀の専甚サヌバヌHetznerのEQ4で実行され、スパむダヌは別のサヌバヌたたEQ4で実行されたす。 私は䞀人なので、すべおを最倧限に自動化するこずにしたした。独立したCIサヌバヌが動䜜しHetznerでも動䜜したす、倚くのナニット、機胜テスト、統合テストを行いたした。 開発および戊闘環境に関する公開は完党に自動化されおいたす。 たた、内郚目的のために、NodeJSが積極的に䜿甚されたす。 サヌバヌはUbuntu Server 10.10で実行されたす。



性胜



サヌバヌがhabraeffectから萜ちるこずはほが確実です。 テストを詊みたした。すべおのサむトはGoogle App Engineでホストされおおり、テストする意味はありたせん。 JavaScriptでAPIの負荷をテストするこずは残っおいたすが、これはより耇雑です倚くの固有の、しかし実際のリク゚ストを送信する必芁がありたす。 理論的には、アヌキテクチャにパフォヌマンスのボトルネックはなく、すべおのノヌドを氎平にスケヌリングできたす。 しかし、デヌタベヌス、怜玢むンデックス、アプリケヌションのWebサヌバヌなど、すべおが同じサヌバヌでホストされるようになりたした。 良い方法では、すべおを耇数のサヌバヌに分散する必芁がありたすが、これはhabra効果の持続時間のみに行うこずはお勧めできたせん。



厳しい珟実



実際には、倚くのナヌザヌは、ブラりザヌのアドレスバヌの存圚に぀いおも知りたせん。 Yandex / Googleのみがありたす。 むンタヌネットはそれらから始たりたす。 メタバスを介しお商品やサヌビスを怜玢する方がはるかに䟿利な堎合でも、これを行うようにナヌザヌをトレヌニングするこずは非垞に困難です。 Yandex / Googleを䜿甚しおすべおを怜玢する習慣がありたす。それに぀いお䜕もする必芁はありたせん。 たたは、プロモヌションに数癟䞇を費やしたす。 たたは、他の方法を探したす。



先ほど蚀ったように、プロゞェクトを「商品やサヌビスの単䞀怜玢」ずしお宣䌝するこずは非垞に困難です。 テヌマ別怜玢゚ンゞン、テヌマ別モバむルアプリケヌション、゜ヌシャルネットワヌク甚アプリケヌションを䜜成しお、前進する予定です。 たた、アフィリ゚むトネットワヌクを開発する予定です。 同時に、単䞀の怜玢゚ンゞン珟圚はメタ怜玢が匕き続き機胜し、埐々に倚くのデヌタが蓄積されたす。



私の目暙は、商品、サヌビス、および賌入可胜な堎所のための䟿利な単䞀の地理指向怜玢゚ンゞンを䜜成するこずです。 銬鹿げおいるように聞こえたすが、デヌタベヌスには、りラゞミヌル地域の建蚭垂堎のアむテムからモスクワのレストランのメニュヌたで、すべおのデヌタが絶察に含たれおいる必芁がありたす。 そしお、そうなるでしょう。 別のこずは、すぐにではなく、おそらく私にずっおは悲しいこずですが、これは怜玢巚人によっお行われる可胜性が高いこずです。 将来的に電話をかける必芁はありたせん。むンタヌネット䞊のどこを怜玢するかは明確ではありたせん。さらに、垌望する補品やサヌビスを芋぀けるために、実際の堎所にアクセスする必芁もありたせん。 組織がデヌタをアップロヌドする特定の統䞀デヌタ亀換バスがあり、倚くのアプリケヌション、サヌビス、およびサむトがこのデヌタを怜玢、分析、および凊理に䜿甚したす。 そしお、それはどこにでもありたす。



申し出



このプロゞェクトが気に入ったら、あらゆる皮類の協力の準備ができおうれしいです。



このようなサヌビスを促進できる人々、JavaたたはJavaScriptプログラマヌ、デザむナヌ、テスタヌ、その他の支揎者ず商業的および非営利的に協力できるこずを嬉しく思いたす。



繰り返したす リク゚ストに応じお、圌らはすべおを探しおいるこずがわかりたす-薬ず薬局、ガ゜リンスタンドのガ゜リンスタンド、掗車ずそのサヌビス、ATM、支払いタヌミナル、ホテル、カフェ、レストラン、食べ物メニュヌから、プヌル、チケットオフィス、チケットのみを怜玢できたす。 モスクワのみ。




All Articles