Tech Reviewの例に関する検索エンジンのレシピ

私はHabrが大好きで尊敬しているので、ここで新しいニッチ検索エンジンを発表すると同時に、コミュニティに助けを求めることにしました。



Tech Reviewは、最新の家庭用および家庭用電化製品のテスト、レビュー、ユーザーレビューを簡単に見つけるのに役立つ新しい検索エンジンです。



彼に関するいくつかの言葉と、独自の検索エンジンを作成するための詳細なレシピ:



急いで解決するために、肘を噛むよりも、購入前に好きな鉄片の実際のユーザーのテストと反応を読む方が簡単であるという事実は間違いありません。 問題は、この手法の売り手ではない、立派な多くの人がこの習慣を知っていることです。 したがって、先に進むほど、「review ...」、「test ...」、「reviews ...」という単語で始まるクエリについて推測します。



テクニカルレビューのタスクは、テスト、レビュー、およびユーザーレビューへのリンクを実際に含む検索結果の形式で「純粋な知識」へのアクセスをシーカーに与えることであり、これを装った「超ユニークなユニークオファー」ではありません。



私たちの検索エンジンについて長い間話をして、その場で象を膨らませるのは意味がありません-TechObzorができることとできないことを知るために、あなたは単にいくつかの要求を尋ねることができます -例えば、あなたの机の上にある技術や購入しようとしているものについて。 私は確信しています-あなたは多くの新しいことを学ぶでしょう:)



次に、独自の検索エンジンを作成するための約束されたレシピに目を向けます。



実際、最近ではニッチな検索エンジンを作成することは難しくありません。GoogleCSEの利点は、開発ツールの所有権が最小限であっても、非常に幅広い機会をもたらします。 そして、これに少しプログラミングスキルとデザインを追加すれば、かなり魅力的な小さなものを手に入れることができます。



しかし、視聴者を獲得するには、検索エンジンだけでは十分ではありません。 彼は、身柄引き渡しの純度において、YandexやGoogleなどの兄を大幅に上回るはずです。 しかし、これを達成するのは簡単ではありません。 そして、ここでの成功は一方向にしかありません-検索インデックスによって制限される、非常に高品質のリソースの選択。



したがって、独自のニッチ検索エンジンを作成する場合は、インターネットをサーフィンして、2つのURLのバッグを慎重に収集する必要があります。



バッグ番号1:検索のトピックに関する高品質の情報を公開しているサイトのリスト。 テクニカルレビューの場合、次のとおりです。

-テストとレビューを公開するオンラインおよびオフラインのメディアサイト。

-テーマ別フォーラムでは、新製品の議論だけでなく、

技術的な問題;

-商用サイトのセクション(主にオンラインストア)

独立したジャーナリストが書いた優れたテストと技術レビューを公開する。



同時に、選択したサイトが独自のレビューを公開することが重要であり、多くの分析なしで他のソースから記事をプルするだけではありません。 これは、記事の後のリンク(結局、大部分は記事の取得元のソースを既に示しています)、またはCopyscapeなどの特別な検証システムを使用してチェックされます。



また、可能な場合は、必要な情報が公開されているセクションをソースサイトで正確に強調することも重要です。 私たちの場合、それは比較的簡単でした-ほとんどのサイトでは、記事はURLタイプdomain.ru/article/stat1.htmlにあります。 次に、URLの重複部分(domain.ru/article/)がリストに入力され、「アドレスにこのURLを含むすべてのページを含める」パラメーターがGoogle CSEで選択されます(ちなみに、Googleによってデフォルトで選択されます)。 これで、このセクションでのみ検索が実行され、サイトの残りの部分は無視されます。



なぜこれが便利なのですか? なぜなら:

-かなり深刻なrunetサイトでさえ、多くの場合、将来の検索エンジンの検索結果をまったく装飾しない、あらゆる種類の素敵なリソースへのリンクを含むリンクウォッシングページがあります。

-サイトには、放棄されたゲストブックや、「すべてのモスクワ売春婦」などのスイーツを含むモデレートの悪いフォーラムがあります。これは、検索エンジンの訪問者を予期せずに喜ばせます。

-1つの同じサイトに、タスクに対応していないものも含めて、異なるフィールドのセクションが含まれている場合があります。また、問題を散らかします。 私たちの場合、「ゲーム」、「インターネットニュース」などのセクションが頻繁に満たされましたが、これは技術レビューとは関係ありません。

バッグ番号2:ストップリスト。 例外ページのリストを作成して維持することは非常に重要です。 その理由は上で説明したのと同じです。 必要な情報セクションを明確に選択することが常に可能であるとは限らないので、反対側に移動する必要があります。サイト全体を指定し、検索結果に含めるべきではないページとセクションをストップリストに追加します。 Googleは、出力から除外するページパターンを定義するための、小さいながらも十分に機能するツールキットを提供しています。 Google CSEで詳しく説明されています。



これら2つのリストを処理した後(1人の編集者の1週間の苦労を経て)、それらをGoogle CSEインターフェースに叩き込んで(この点に関してはすぐにすべてが熟考されています)、検索エンジンのテストを開始できます。 適切で美しいクエリだけでなく、ガベージページの出現を引き起こすクエリを使用して、長時間、慎重にテストする必要があります。 識別されたすべてのページとセクションが停止リストに追加されます。 そして無限に-完璧に制限はないので:)



このアルゴリズムによると、TechObzorがテストとレビューを探しているサイトのセットでかなりの作業を行いました。 しかし、この作業中、私の目はぼやけ、手が詰まり、脳は輪になりました。 したがって、私はあなたにそれを完了するのに助けを求めたいです。



原則として、ヘルプは簡単で、ブックマークにあるリンクや検索できるリンクを2つの技術レビューバッグに追加することで構成されています。 ハブロフスクの人々のほとんどが忙しいことを理解しているので、私はあなたの努力が評価されたままにならないことを約束します。

-テストとレビューを公開し、Habrahtaから私に送信された、またはコメントに示されたサイトへのすべてのリンクに対して、私はそれを送信した人のカルマにプラスを保証します。

-テクニカルレビューの発行で見つかったゴミページまたはセクションごとに-コメントにプラス。



レビューサイトへのリンクは、テクニカルレビューには存在せず、サイトに記載されている簡単なルールに従う必要があります (「検索したい人向け」リンクをクリックします)。 別の人が同じリンクを公開する場合、プライマシーの原則が機能します。



私はこれらのプラスが誰にとっても特に寒くも暑くもないことを理解していますが、私にとっては、私たちの仕事の助けに感謝することはできません。



応答してくれたみんなに感謝します!



All Articles