インテグレーターサイトからコピーペーストを使用してWebサイトを区別する方法

最近、 コピーアンドペーストサイトとYandexによるその発行に関する記事を読みました。元のページと「コピーアンドペースト」の間の行はどこに行けばいいのでしょうか。 彼らが言うように、理論の観点からは、理論と実践はまったく同じものですが、実際にはこれは事実とはほど遠いです。 したがって、私はプロジェクトサイトの実装に関するささやかな経験を共有することにしました。このサイトには、単一の「ギャグ」は含まれていませんでした。



私はかつて、その時に運営されている学位評議会に関する情報を体系化するためのアイデアでしたが、緊急の必要性さえありました。 2012年のどこかで、約3200の論文評議会があり、それぞれの情報はしばしばネットワーク上にありましたが、それは直接配置されていませんでしたが、あらゆる種類の回り道でした(反対者の一部は大学院のセクションを通じて彼らの組織のウェブサイトにありました、他は「科学」を通じて、他はシャーマンのタンバリンがある遺跡の暗い生気のない廊下を通過する他の考えられない通路を通じて)。 私はこの状況に一人ではないことを理解していたため、需要があり(そして検索結果があります)、サイトdissovety.ruを作成し、そこに見つけたすべての情報を配置し、それを適切に体系化することにしました。



すぐに言ってやった!



知っていたワードプレスでサイトを作成したので、すぐに問題にぶつかりました。市議会が暗号、都市、科学の専門分野で見つけられるようにする必要がありました。 方法はシンプルで美しいことがわかりました:各都市に見出しが作成され、科学の専門分野にタグが付けられました(タグクラウドはナビゲーションの有効な要素になり、同時に特定の専門分野ごとにデータベースに入力されたディアサートの数を示しました)、ディッセに関する情報はタイトルに別の投稿でしたこれは評議会の名前とコードです。



残念ながら、このサイトはほんの数か月間(およそ2013年1月から10月まで)存続していました。 約50の懲戒評議会(おそらくもう少し)に関する情報が含まれていました。さらに、すべての規律が閉鎖された改革が行われたときに、約80〜100の懲戒評議会が翼で待っていました。 300人以上の反対者があり、2か月目と3か月後に合計が600に増えました。 その時までに、私はすでに論文評議会を決めていたので、個人的には不必要になりました。また、少数の演技のヒントにより、正しいものを見つけるのが非常に簡単になりました。



しかし、私はこのプロジェクトからいくつかの結論を引き出しました。



まず、少なくとも最初の情報を含むページの後に、サイトのページが検索結果に(市議会の番号またはその名前で)表示されることを非常に論理的に予想しました。 実際には、それは異なって判明しました。私のサイトのページは常にソースサイトよりも高い(!)ことが判明しました。 この説明はこれであるように思えます:私のサイトは市議会に完全に専念しており、各市議会の投稿は明確に構成されていました(もちろん、検索エンジンはテキストの品質を評価しませんが、これのおかげで、各投稿は非常に長くはありませんが、短すぎず、自然に含まれています検索クエリのトピックの観点からその価値を語った多くの単語)。 各投稿の構造はほぼ次のとおりでした:論文評議会の名前とコード、本文-所在地、施設、所在地、電話番号、科学秘書と議長の氏名、論文評議会が防衛のための仕事を受け入れる専門分野、およびその他の論文発表者に役立つ情報。 ページ-情報の提供者について話すと、収集した情報の構造が不十分で、多くの場合、サイトのさまざまなセクションで検索する必要がありました。



第二に、訪問。 サイトの最初の月は10〜15の談話評議会でした。資料提出のロジックとそれを収集する方法を完全に理解していないため、急いで記入する必要はありませんでした(情報を検索し、ポイントに従って提示するための談話を得るには30〜50分かかりました)私は必須として定義しました)。 訪問はランダムで1回だけでした(さらに、新しい投稿、最終的にはどのように見えるかを見るだけで、トラフィックの半分を「キャッチ」しました。1、2か月後に検索トラフィックが始まりました。多くのことがあったとは言いません。計画された量(1日あたり1つの協議会あたり1人の訪問者の計算に基づく-少なくとも、協議会自体の統計値であり、ワカサイトのトラフィックをわずかに修正した)。プロジェクトの存在の4〜6か月の間に、その位置は着実に高くなったプライマリソース(と 情報を入手したソースページへのリンクを常に提供し、誰も私を参照しなかった!)そして-リストの廃止と完全な不明...



第三に、インテグレーターサイトモデル自体の成功。 一方では、その充填のために、いくつかの努力をする必要があります(記述されたオブジェクトのベースを見つけ、CMS機能のフレームワーク内でそれらの体系化を検討し、サイト上の情報を構築するための特定の一般的なスキームと原則を確立し、それらに従って各オブジェクトを記述します)。 一方、正しいアプローチでは、最初のステップからサイトインテグレーターが良い結果を出し、それを埋めた後、それを維持するための最小限の労力しか必要ありません(この段階で、フォーラムを接続してユーザーエクスペリエンスの統合を開始することもできます)。



プロジェクトが開始され、「むき出しの熱意」で動作したので(私は自分に時間制限を設定しました-1日1時間)、その経済的コストは0ルーブルと同じペニーでした(「無料の場所」と無料のドメインの形でのホスティングがありました)名前)。 このサイトはいかなる方法でも宣伝されていませんでした-おそらく、読者の何千人にもわたってTwitterに投稿し、GoogleとYandexに見せることができます(ここではインデックスを作成します)。 その結果、私はインテグレーターサイトをほぼ作成することができました(リストがキャンセルされていなければ、準備はできていました-その時までに、リーズナブルな価格で数か月で各ディスカッション評議会に関する情報を集めていたアーティストを既に見つけていました)。 私は「人々のためのサイト」を作成しましたが、このプロジェクトでは「ギャグ」という単語を書きませんでした。そこにあるものはすべて他のサイトから取られ、多くの方法でソースから取られた正確な表現で当時は取るに足らないものでした-それはすべて、ドナーサイトから取得した情報の体系的な表示に帰着しました)。



プロジェクト自体はもはや有効ではないという事実にもかかわらず、検索結果に関するいくつかの質問が残っています。 私のサイトが元のソースよりも高い位置を占めることは公平でしたか? そうでない場合、私のサイトのページのソース資料に関してどのような立場を取るべきですか? サイトが他のソースから取得した高品質の情報を順序付けられた形式で含み、これらの同じソースを指している場合、つまり、基本的にすべての利用可能な情報を要約し、単一の場所で利用可能にし、そのコンテンツをオリジナルと見なすことができますか、またはそのようなサイトにフィルターを適用する必要がありますか?



そして最後に、永遠の質問:元の高品質な「人々のためのサイト」と他のすべてのコピー&ペーストとの間の境界線は実際にはどこにあるのでしょうか?



PS私が得た経験は興味深く、私の意見では肯定的であることが判明したので、同じ「インテグレーター」のアイデアに基づいて来年新しいプロジェクトを立ち上げることを考えています(数千の異なるオブジェクトに関する情報を組み合わせることはユーザーにとって便利ですフォーム)。



All Articles