自動キャプチャ入力-インターネットを征服する理論と実践

2011年、「スパム」という用語の75周年は、毎日2億回のcaptchaの導入によって特徴付けられました。







これらの入力はすべて、サイト管理者のスパムボットとの闘争の結果です。



インターネット上で積極的にビジネスを行っている多くの人々のキャプチャ認識プロセスを自動化することは緊急の問題です。 「悪い、迷惑なスパマー」などのビジネスマンや専門家に関連することができます。 ただし、少なくとも近い将来、スパムの投稿プロセスを停止することはできません。



ここでのリンクマーケティングは、プロモーションのタスクのソリューションを完全かつ独自に組み合わせて、検索エンジンの観点からプロモーションされているサイトの評判を高めます。 これは、サイトへのすべてのリンク(スパム投稿からのリンクを含む)がGoogle、Yandexなどの結果における位置を増やすという単純な理由で発生します。 したがって、この「1石で2羽の鳥を殺す」方法は、最初は有益です。 また、インターネットビジネスマンの大部分はスパム投稿に苦労するべきではありませんが、スパムを自分の目的に使用するように努めるべきです。



したがって、「キャプチャのバイパス」の問題を解決することの関連性は疑いの余地はありません。







手動モードで企業を運営する場合、数百人のポスターを雇うことにより、タスクは自動的に解決されます。 しかし、この方法の有効性について話すには、今日でなければ、明日は必要ありません。 はい、顧客のキャプチャを入力する問題は、ここでは実際には関係ありません。 しかし、この行動方法による組織的、時間的、経済的コストは深刻な批判に耐えられません。



したがって、専門のソフトウェア製品が積極的に開発されているのは自動ポスターである最初の年ではありません。 それらの一部は市場で非常によく知られ(同じXRumer)、一部は一部の企業内でのみ開発および使用されています。 自動ポスターを使用する場合、「キャプチャをバイパスする方法」という問題の解決策は2つの方法で可能です。







手動入力





大量の投稿を行う場合、手動入力は受け入れられないことにすぐに気付きます。



今日のキャプチャの認識は、特別なサービス(アンチゲートなど)に委ねることができます。 発行価格は、認識1,000回あたり1〜2.5ドルです。 この方法の欠点は次のとおりです。







このタイプのサービスの利点は、実際の人間のオペレーターによって認識が行われるため、キャプチャのタイプから独立していることです。



ソフトウェア認識





今日、難しい理論的および実用的な問題は、グラフィック画像の人工認識システムの開発です。 キャプチャに適用される光学式文字認識は、スキャンされたテキストや手書きのテキストを認識するほど単純なタスクではありません。



ただし、これにもかかわらず、キャプチャ認識プログラムの作成は私たちの専門です。 もちろん、このアクティビティは否定的にも含めて異なる方法で処理できますが、プログラムのおかげでコメントが自動的にブログに投稿され、広告性のあるSMSメッセージが送信され、メールアカウントが後続のスパムに登録されることがわかります。 しかし、ナイフの販売と比較することができます-あなたはナイフでパンを切ることができますか、誰かを殺すことができます...この場合、ナイフのメーカーまたは販売者が責任を負いますか?..誰もが自分の意見を持っています...



あらゆる種類のキャプチャを認識するためのユニバーサルソフトウェア製品は存在しません。 そのため、自動ポスターのソフトウェアには、必要な種類の認識モジュールが順次追加されます。 このようなソフトウェアの開発は、たとえばwww.captcha-lab.orgのように、個々のチームによって実行されます。 私たちのポートフォリオでは、キャプチャ入力のデモンストレーションプログラムは1つのタイプのみに提示されていません。 特に興味深いのは、CMS Bitrix captcha(公式には1C-Bitrix)の開発チームです。 このCMSはロシアで人気があるだけでなく、有料の循環「エンジン」の中で1位です。 当然、Bitrix captchaの「ハッキング」

多くの専門家に興味と関心を持っています。 2006年には、このような「操作」を実行する試みも成功しました。 ただし、その後CMS Bitrixの開発者はキャプチャの種類を変更し、これまでのところ不死身のままです。 www.captcha-lab.orgのデモプログラムが明確に示すように、この問題はBitrixのさまざまなバージョンで64%と60%というかなり高いレートで解決されています。 これらの数字は十分に高いと思いませんか? 実際、当社のプログラマーチームがリリースした他のタイプのキャプチャソフトウェアは、最大90%の確率で認識されています。 完璧には本当に制限はありません。 しかし、これらの指標は高く、仕事に十分です。 captchaサービスを使用しても、80〜95%のケースでのみ正しく認識されることに注意してください。





1-古いバージョンのcaptcha CMS Bitrixの認識







2-captcha CMS Bitrixの新しいバージョンの認識





キャプチャ認識プログラムの開発にはいくらかかりますか? タイプ、複雑さに応じて100〜500ドル。 これは1回限りの無駄です。 したがって、キャプチャサービスとは異なり、自動認識により発行価格を真剣に勝ち取ることができます。 さらに、大幅な時間の増加も提供されます。ソフトウェアによる認識に1秒以上かかることはめったにありません。



弊社のウェブサイトのポートフォリオセクションで作成されたすべての「CAPTCHA」をご覧いただけます。



All Articles