
最近、学校の電子メールアドレスを収集して、学内競技会への参加を招待する仕事がありました。 Habrには、商用および非商用サイトからメールを収集するための専用の投稿がいくつかありました。 このような必要性は定期的に発生しますが、自動または半自動オプションに対して真に効果的で文明化された単一のオプションを見たことはありません。 ツールの99%は電子メールジェネレーターと「販売拠点」、またはデスクトップバギーソフトウェアであり、使用する意欲はありません。
叙情的な余談。 スパムとスパム対策のトピックは非常に細かいため、ニュースレターを受け取る人への敬意の観点から、すぐに定義:文明化された(または繊細な)方法を定義します。 リストの手動バージョンが最も最適ですが、現代生活の速度により、可能なすべてを自動化する必要があります。 ニュースレターの目的は、できるだけ多くの人にできるだけ短い時間で知らせることです。
数週間前、この問題を解決するspider-post.comサービスの開発者から連絡がありました。 彼はリソースをテストし、Habréにレビューを投稿することを提案しました。 同意した このトピックは私にとって興味深いものですが、同様のツールは見つかりませんでした。 コメントに他のサービスへのリンクが表示されてうれしいです。
すべての質問は、開発者に照会されます。 それらへの回答はコメントに表示されます。
次のように、電子メールを収集するタスクの妥協案の変形を見ました。
- 特定の基準に従って、ビジネスに関連するサイトを選択します。
- それらからメールを受け取ります。
- 有効性を確認してください。
- 疑わしいメールの手動クリーニングを実行します。
- 継続的な購読を申し込むトライアルニュースレターを作成します。
Spider Postも同様のアプローチを取ります。

- 地域を選択し、ビジネスを特徴付けるキーフレーズのリストを指定します。
- サービスは、指定されたパラメーターに従って検索エンジン内のサイトを選択し、電子メールリストを収集します。 完成したリストは、数時間以内に取得できます。 開発者によると、サービスは「@」の後に書かれた内容を分析し、サイトが生きているかどうか、電子メール、リソースの年齢、商用かどうかをチェックします。
- この後、リストを手動でダウンロードしてクリーニングできます(レポートには、クリーニングをより効率的に実行するためのサイトのアドレスも含まれています)。
何かを理解するいくつかのトピック(高校、蛍光体、境界セキュリティ)でテストしました。 以下の結果と結論。
完了した注文ページのスクリーンショット:

結果の詳細情報:

印象はまちまちです。
- 最終的にごみのリストに入る可能性を最小限に抑えるために、非常に特殊なクエリを設定します。
- すべての場合において、メールデータベースは数万のアドレスと多数の「奇妙な」メールで取得されました。
- このようなドキュメントを手作業で完成させることは単純に非現実的であり、B2B市場の大部分がこのような数の参加者、したがって電子メールを自慢することはほとんどありません。
機能に関する開発者向けのいくつかのヒント。 機能に追加したいもの:
- 検索エンジンのクエリ言語を使用する機能。これにより、選択するサイトの数を絞り込むことができます。
- 追加情報の収集。 サイトのアドレスに加えて、Y。カタログまたは検索エンジンからのセクションとその説明。
- どのサイトからアドレスを収集するかを指定する機能(たとえば、学校での私のタスクには連邦政府のリソースがあります)
これらのシンプルなアドオンは、リスト上のゴミの割合を減らし、さらなるクリーニングを簡素化します。