Googleベースは1兆ページに達しました

Googleの基盤は1兆URLでマイルストーンに達し、指数関数的に成長し続けています。



この兆は、すべての重複を削除した後、一意のWebページのみをカウントします。 検索ロボットはそれらをすべて登録しましたが、実際にはすべてがフルテキスト検索用にインデックス付けされているわけではありません。



検索エンジンは1998年に2800万ページのインデックスに登録され、2000年までに10億ページに達しました。 過去8年間で、インデックスはさらに1,000倍に成長しました。 公式ブログによると、Googleの開発者でさえ、ウェブ情報の量がこれほど急速に増加することを想像できなかったでしょう。 現在、インターネットは1日に数十億ページで成長しています。



このようなデータ配列を処理するために、Googleは近年、データセンターの能力を大幅に向上させました。 10年前にサーバーラック内の1台のワークステーションが数時間でウェブ全体(2600万ページ)のPageRankグラフを計算でき、その後1週間後に検索エンジンがインデックスの再作成を行わずに動作した場合、Googleはインデックスをより頻繁に更新します。 1兆個のWebページ間のリンクは、1日に数回再カウントされます。



All Articles