インターネットインテリジェンスに特化した一連の出版物の次の記事では、高度な検索演算子Google(クイック検索演算子)を使用して特定の人物に関する必要な情報をすばやく見つける方法について検討します。
最初の記事へのコメントで、読者はより実用的な例とスクリーンショットを求めたので、この記事には多くの実践とグラフィックスがあります。 「高度な」Google検索の機能を実証するために、著者の個人アカウントがターゲットとして選択されました。 これは、彼の私生活に過度の関心を持つ人を怒らせないようにするためです。 インターネット上で自分の存在を隠そうとはしなかったことをすぐに警告したいので、説明した方法は一般の人々に関するデータを収集するのに適しています。 興味のある読者は、上記のアカウントに関するクエリの例を繰り返し、情報の収集がどれほど簡単かを評価することをお勧めします。
特定の人物に関する情報を収集して分析する前に、その人物に関するどのようなデータが存在するかの全体像を提供する必要があります。
このようなマップは、特定の問題を解決するために必要なレベルまで詳細にする必要があります。 情報の検索は、初期データセットから始まります。 私たちの場合、それは姓、名、および勤務地になります。 残りのデータはどこかにありますが、利用可能なデータと接続することはできません。 したがって、仮説を定式化し、検索クエリを使用してテストします。
個人に関する情報のソースは次のとおりです。
この記事では、項目1を検討します。 -ソーシャルネットワーク上の著者のアカウントを計算します。
目標1:ユーザーのニックネーム
ニックネームとは何ですか、どのように選択しますか?
ニックはインターネット上の私たちの名前です。私たちはそれを選択し、個人用メールボックスを作成してから、さまざまなサービスで頻繁に使用します。
ニックネームを選択するときは何にも制限されませんが、インターネット名の形成にはお気に入りのアルゴリズムがあります。
- あなたの名を持つゲーム:姓、名+姓、名+誕生年、名+日付、イニシャル;
- お気に入りのキャラクターの名前を使用したゲーム(tovbender、napoleon);
- 私について:職業、心理学(coolhacker、雑音);
- 趣味のデモンストレーション:サッカー選手、ボクサー。
- 「だれも推測しないように」:反対の単語、英語レイアウトのロシア語、ラテン語の単語など。
ニックネームを知らないが、人について何かを知っている場合、すでに仮定を構築してテストすることができます。
ユーザーのニックネームを計算する良い方法は、ソーシャルネットワーク上の彼のページを検索して分析し、個人のメールアドレスを検索することです。
次のような簡単なクエリを使用して、特定のユーザーに関する情報の検索を開始できます。
ここで、「daisy」は会社の名前です。
現時点では、Google検索エンジンのいくつかの機能を覚えておく必要があります。
- Googleはクエリを左から右に読み取ります。
- Googleはレジスタを区別しません。「地球」と「地球」は同じです。
- 要求の長さは32ワードを超えてはなりません。
- *は、リクエスト内の1つの単語を表します。
- 正確なフレーズを引用して検索できます。
- クエリ内の単語の間は、目に見えない論理的な「AND」です。
- Google自体は単語を活用できます。
- 「-」演算子は、指定された演算子の直後に配置された式を含む出力結果から除外します(常にスペースなし)。
- ページの上部には、Googleが最も関連性が高いと思われるページがあります。 それにもかかわらず、彼は私たちの考えを読むことができないので、これは彼の予感です。
- 検索パラメーターを調整するには、高度な検索演算子が必要です。
これで、記事の著者による同様のクエリを入力し、多くのページを取得できます。その中には、ソーシャルネットワーク上に目的のページがあるはずです。
検索エンジンの結果には多くの情報が含まれており、ソーシャルネットワーク上のページを見つけるには、多数のページを修正する必要があります。
注:
ところで、ある会社の人を見つけたいが、彼の姓を忘れてしまったらどうしますか? ここで、アスタリスク演算子が役立ちます:
*
そして、LLC「デイジー」の人を探していて、JSC「デイジー」、ANO「デイジー」、FSUE「デイジー」などの「デイジー」が何百万人もいる場合
オプション1.完全なフレーズ「LLC Camomile」を検索します。
オプション2.不要な単語「マイナス」:-ANO-AO -FGUP(ただし、「デイジー」がFSUE「オレンジ」と友達になったとページに表示されている場合、「zamususat」と目的の結果も可能です。
ここで、問題を絞り込み、VKontakteソーシャルネットワークに関する記事の著者のページを見つける必要があります。 これにより、ユーザーのニックネームの1つを特定し、電子メールアドレスを計算できます。 これを行うには、siteなどのステートメントを使用すると便利です。 任意のレベルの特定のドメインに検索を制限します。
2番目のリンクは、VKontakteネットワークに関する記事の著者のページに既につながっています。 著者が意図的に短いニックネームを選択したことに注意してください:alexdorofeev。 すべてのインターネットリソースがページへのリンクを自分で設定できるわけではなく、自動的に生成される場合もありますが、メールアドレスから取ったニックネームが含まれている場合があります。
取得した情報と知識を使用して、Facebookネットワークで同様のページを見つけようとします。
最初に、幸運なことに、ブラウザでhttps://www.facebook.com/alexdorofeevの URLを入力しますが、残念ながら、このページは他の誰かのものであることがわかります。 次に、テスト済みの手法を使用して、site:facebook.comをリクエストに追加します。
ユーザーはその時点で警戒し、検索エンジンへのページの「提出」を禁止していたため、発行の結果で探しているプロファイルへの直接リンクはありません。
ここで、少し余談をして、Googleを含む検索エンジンの動作を覚えておく必要があります。
検索エンジンでできることとできないことは何ですか?
一般的な検索エンジンは、次のアルゴリズムに従って動作します。
- 検索エンジンボットはサイトをバイパスします。
- ページのコンテンツにインデックスが付けられます。
- ユーザーのリクエストに応じて、関連するページへのリンクが取得されます。
検索エンジンは次のことができません。
- 許可されたユーザーのみがアクセスできるインデックス情報。
- フォームに記入した後に利用可能なデータ、たとえば、さまざまなデータベースからのアンロードの結果。
- ビデオ、写真、音声素材から情報を定性的に抽出します。
さらにいくつかのニュアンス:
- コンテキスト:問題の結果は、ユーザーのリクエスト、以前のリクエストの履歴、および他のユーザーによるページビューの履歴に依存します。
- 検索は、ユーザーがクエリを入力した言語でのみ実行されます。
- いくつかの利益相反があります。検索エンジンは、ユーザーがクリックする広告でお金を稼ぎます。必要なページが検索結果の最上部にないためです。
- 検閲は、他人の権利(著作権、忘却権など)の侵害により効力を持ちます。
Facebookは、サイトのインデックス作成をあまり好まないインターネットリソースのカテゴリに属し、robots.txtに直接報告します。
Facebookの秘密のユーザーのページを検出するには、このネットワークにログインし、組み込みの検索機能を使用する必要があります。 ユーザーのページへのリンクが「リーク」して検索エンジンに表示される場合がありますが、これはユーザーが公開用に著者の資料を故意に公開した場合のみです。
検索を使用すると、著者のページが簡単に検出されます。
ページURLを分析することにより、別のユーザーのニックネームadorofeevを特定できます。
したがって、2つのニックネームが既にあります:alexdorofeevとadorofeev。 人気のあるリソースには多くのユーザーがいるため、ニックネームは実際に使用したいものとは異なる場合があります。そのため、彼の「ネイティブ」識別子は既に誰かによって占有されています。 このため、この記事の著者にはHabréのニックネームがあります:alexdorofeeffですが、彼はadorofeevの方が好きです。
ニックネームがわかれば、適切な人物に関連している可能性のあるページをさらに検索できます。
ここで、Googleで再び脱線し、次の点を思い出してください。
- デフォルトでは、Googleはページのすべての部分(URL、タイトル、テキスト、リンクのテキスト)で式(引用符で囲まれた単語またはフレーズ)を検索します。 同時に、特別な「高度な」演算子を使用すると、必要な場所を正確に指定できるため、探しているテキストが正確になります。 これを行うには、演算子を使用する必要があります:inurl:、intext:、intitle:、inanchor:、および接頭辞allを持つ対応するもの。
- Googleは論理式と括弧を理解しています。 AND-論理的な「AND」。デフォルトでは、検索バーでスペースで区切られた単語の間にあります。 ORまたはI-論理「OR」。
- 演算子を使用する場合、コロンの後はスペースなしの目的の式にする必要があります。
- プレフィックスがallの演算子を使用すると、コロンで区切られた一連の式にスペースで区切って適用できます。 同じタスクの場合、演算子をすべて使用せずに使用できますが、括弧と論理式を使用できます。
ページURLに目的の単語を含むページを検索するinurl演算子を試してみましょう。 著者のニックネームはすでにいくつかわかっているため、次のリクエストを行うことができます。
inurl:(adorofeev | alexdorofeeff | alexdorofeev)
問題の結果では、それぞれのアカウントのページがすぐに見つかり、ページの一部は作成者のものになります。 したがって、使用されるニックネームに関する仮定がある場合、調査の最初に潜在的に興味深いページのリストを取得できます。
ニックネームでトピックを締めくくり、このニックネームが多くの人気のあるリソースで使用されているかどうかをすばやく確認できるサービスに注目したいと思います。 そのため、特定の人の追加ページを見つけることができます。 同様のサービスの例: https : //namechk.com/
電子メールを知る方法は?
これで、ユーザーのお気に入りのニックネームのセットを取得したので、私たちは彼の個人的な電子メールを調べることができます。 なぜ必要なのですか? 手紙の著者を判断するために、特定の電子メールがこの人物に属しているかどうかを調べる必要がある場合があります。 また、電子メールは、フォーラムなどでユーザーが投稿した広告を検索するのに役立ちます。
ニックネームは知っていますが、メールサービスドメインはまだわかりません。 それでは、仮定を立てて確認しましょう。 ユーザーはロシア出身なので、次のサービスの1つ以上を使用する可能性が最も高くなります。
- Mail.ru
- Yandex.Mail
- Google Gmail
- ランブラーメール
したがって、ニックネームadorofeev、alexdorofeev、alexdorofeeffを使用してアドレス(現時点での仮説)を生成できます。
そのようなアドレスが実際に存在するかどうかを確認するにはどうすればよいですか? オプションの1つ:SMTPを介した各サービスのメールサーバーとの「チャット」:
手順1.特定のドメインのメールサーバーを検索します。
nslookup -type=mx " "
手順2.メールサーバーに接続し、メッセージ送信の開始をシミュレートします。 サーバーが受信者の名前に「OK」と答えた場合、そのようなアカウントがあります。
オプション1:メールが存在します。
telnet gmail-smtp-in.l.google.com 25
オプション2:電子メールは存在しません。
メール確認
郵送先住所があるかどうかを確認したら、特定の住所が必要な人に関連付けられているかどうかを確認できます。
mail.ruでは、一部のユーザーが独自のページを作成し、my.mail.ru / mail / nick /に従ってアクセスできます。
アドレスの1つを「パンチ」します。
また、inurl:と既知のサイトオペレーターの組み合わせを使用して、すべてのMail.ruプロジェクトのユーザーページを表示することもできます。
inurl: site:mail.ru
人がどのように見えるか、名前を知っているか、VKontakteソーシャルネットワークで既にページを見つけている場合(私たちの場合)、特定のメールアドレスの所有権を確認するタスクは大幅に簡素化されます。 このメカニズムを使用して、ページへのアクセスを復元できます。 運が必要です。そのようなアドレスを持つユーザーが存在し、写真を投稿する必要があります。
ニックネーム「adorofeev」の4つのアドレスオプションを確認し、2つのアドレスではページがまったく存在しないことを確認します。
ただし、Gmail.comの対応するアドレスには、著者のページがあります。
そこで、実際の個人用メールアドレスを計算しました。
企業のメールアドレスの計算方法は?
ここでは、状況ははるかに単純です。 問題は、多くの組織がメールアカウント名の形成に関して独自のルールを持っていることです。これはあまり多様ではありません。イニシャル+姓、名前の最初の文字+姓などです。 特定の会社で必要な人の住所を形成するために、特定の会社でどのルールが使用されているかを理解する必要があるだけです。
次のフォームのリクエストをGoogleに送信します。
email @
発行結果をスクロールすると、従業員の個々の住所が見つかり、すべてが明らかになります。
ジオタグでInstagramユーザーを計算する方法は?
それでは、Instagramで著者のアカウントを計算してみましょう。 まず、最も明白なオプションをチェックします: https : //www.instagram.com/adorofeev/、https : //www.instagram.com/ alexdorofeeffおよびhttps://www.instagram.com/a lex dorofeev /これはそうではないことがわかりますそれらのアカウント。
特定の会社で働いていると判断したら、適切なジオタグで写真を検索できます。 私たちの場合、それは「NPOエシェロン」になります。
このジオタグを使用した出版物は、ほとんどが会社の従業員によって作成されていることがわかります。 エシェロンの多くの従業員の加入者には、著者のアカウントも必要であると想定するのは論理的です。
タイムマシンの使用方法は?
あなたのtwitterアカウントに関する同様の分析の後、著者が現在利用できないサイトadorofeev.ruを実行していることがわかります。 この状況で何をすべきか? 結局のところ、姿を消したサイトの資料は本当に興味深いものになる可能性があります。 著者の実践では、同様の姿を消したサイトに公開された刑事事件資料が含まれていたという状況がありました。
サイトがごく最近オフになった場合は、キャッシュオペレーターを提供するGoogleが再び役立ちます。それを使用して、検索エンジンによってマイニングされたキャッシュページを抽出できます。
cache:www.adorofeev.ru/
2月5日のサイトはまだ公開されていましたが、面白くありませんでした。
数年前のもっと遠い過去を調べたいです。 タイムマシンがこれを行いますが、奇妙なことに、次のURLの好奇心user盛なユーザーが利用できます: https : //archive.org/web/
著者のサイトを「パンチ」すると、過去にいくつかの資料があったことがわかります。
さらに、特定の日付を選択すると、特定の瞬間にサイトのコンテンツを表示できます。
結論の代わりに:プロセスの自動化と他のGoogleオペレーターに関するいくつかの言葉
Googleを使用して興味深い情報を検索するプロセスを自動化することは可能ですか? それは可能であり、すでに良い試みがあります: theHarvesterスクリプト。
Googleはこれを歓迎せず、苦労しているため、あらゆる種類のスクリプトを適用した結果の信頼性をさらに確認する必要があることに注意してください。 上記で検討した完全に合法的なオペレーターと遊んでいるだけでも、あなたは絶えずcaptchaを見て、あなたがロボットではないことを証明します。
この記事は非常に膨大であることが判明したため、インターネットのインテリジェンスにも役立つ可能性のある他の多くのGoogleの高度な検索演算子は考慮しませんでした。 この方法で演算子を使用することが興味深い場合は、次の記事のいずれかでこのトピックを継続します。
文学
- 私の名前は何ですか:インターネット上で人を定性的に「パンチ」する方法は?
- インターネットインテリジェンスインアクション:Mr./Ms。 ハブラマン?
- 近代都市の安全な生活を確保するための脅威の特定におけるソーシャルメディア Aleksandr Dorofeev、Alexey Markov、Valentin Tsirlov
- ペネトレーションテスター向けGoogleハッキング、第3版第3版、ジョニーロング、ビルガードナー、ジャスティンブラウン。