Googleブックスは、世界の書籍の総数を決定しました

画像



ご存知のように、Googleブックスプロジェクトは私たちの時代の最も野心的なプロジェクトの1つです。 電子形式で書籍の単一のデータベースを作成することは、著者、出版社、およびその他の著作権所有者と交渉する必要があるため複雑です。 このプロジェクトは多くの点で興味深い-社会的、技術的、ロジスティック。 現代社会への影響もあるべき場所を持っていますが、現時点ではこの影響はそれほど強くありません。 しかし、これはそれについてではありません。 実際、プロジェクトの作成者は、世界のすべての本(本の総数ではなく、本の総数)をカウントしようとしました。 このような計算ではエラーが避けられないことは明らかですが、それでもGoogleに期待できます。 したがって、結果の数は膨大です-129864880タイトルが出てきます。



残念ながら、専門家が使用する書籍のカウント方法は特に宣伝されていません。 さまざまなカタログが使用され、大学図書館、公共図書館、私的コレクション、美術館、その他の組織にリクエストが行われたことが知られています。 「もみ殻から穀物」を分離するための堅牢なアルゴリズムを作成するのは難しい作業ですが、Googleがそれを行ったようです。 もちろん、本の数を分類、分類、分析するためのアルゴリズムを考える必要がありました。これは複雑で複雑なアルゴリズムのシステムであり、これについて詳しく知りたいと思います。



一般的に言えば、計算は怠idleな好奇心からではなく、プロジェクト内で行われた作業の実際の範囲を評価し、さらにプロジェクトを継続し、(可能な場合)完了するために行わなければならない努力を評価するために行われました。



書籍の数を計算するとき、企業はほとんどの場合、情報源としてさまざまなISBNカタログを使用しました。これは、前世紀の60年代初頭から存在していました。 興味深いことに、分析中にカタログの名前にエラーが見つかりました。約1.5千冊の本が同じ識別子を受け取りました。Googleの従業員は、カタログが忍び寄る図書館に既に通知しています。



興味深いことに、最初に計算すると、Googleは10億に近い数字を獲得しました。 ただし、すべてのコピーと複製を削除すると、書籍の数は6億に減りました。 さらに徹底的な分析を行った結果、最終的な数値は129864880の値に達しました。このような大量の書籍にどれだけの情報が量的に含まれているかを知ることは興味深いでしょう。 一般に、Google開発チームによる興味深い研究であり、成功裏に終了しました。 本好きな人は誰ですか?すでに印刷物で完全なコレクションの収集を開始できます:-)



プロジェクトに関する詳細情報はソースにあります。



All Articles