Googleは新聞のデジタル化を拒否しました

昨日、Googleは新聞社のマイクロフィルムやその他のアーカイブ資料のスキャンとインデックス作成を行うNews Archiveプロジェクトの終了を通知する書簡を出版社に送りました。 代わりに、Googleは「パブリッシャーがサイトからコンテンツを直接販売できるGoogle One Passプラットフォームの開発を含む、新聞業界を支援する新しいプロジェクト」に焦点を当てます。



5年間のニュースアーカイブプロジェクトは、世界の図書館の一種であるGoogleブックスの書籍と同じアーカイブを古い新聞に作成するという野心的な試みでした。 映画はGoogleを犠牲にしてスキャンされ、パートナーはサービスのページに広告を表示することで利益を分けました。



このサービスは、通常のニュース検索に追加されるもので、利用可能なアーカイブは30日間のみに制限されています。 アーカイブに制限はありません。 情報源ははるかに少ないですが、最も初期の報告は18世紀半ばのものです。 各クエリの検索結果は、年および情報源別にソートされます。 年や10年ごとに異なる単語に言及する頻度も確認できます。 ほとんどのテキストは無料で入手できます。



5年で、Googleは250年の歴史をカバーする6,000万の新聞ページを既にクロールしました。 パートナーへの手紙の中で、Googleは既に作成されたアーカイブへのアクセスを引き続き提供すると述べたが、サイトは更新されず、新しい機能は開発されません。



さらに、新聞はスキャンされたすべてのコンテンツを無料でピックアップし、ウェブサイトに投稿できるようになりました(以前はこのサービスは有料でした)。



Googleがプロジェクトの継続を放棄することを決定した理由を述べることは困難です。 著作権に関するいくつかの問題/リスクがあるかもしれません。 または、Googleは単に新しい情報の価値を比較的低いと考えていた、彼らは言う、彼らは言う、アーカイブはすでにかなり完全であり、小さな地方新聞をいじるは途方に暮れているだけです。



別の可能性のあるバージョンは、技術的な複雑さと処理の高コストです。 Googleは、全文検索が可能なグラフィックイメージ形式のアーカイブを公開しました。 新聞のテキストを認識することは、特定の書式設定とハイフネーションのために、本よりもはるかに困難です(記事は多くの場合、あるページから別のページ、およびランダムなページおよびランダムな場所に転送されます)。 慎重な人間の監督なしに行う方法はありません。



また、ニュースアーカイブプロジェクトへの参加者が少なく、広告が新聞のデジタル化のコストに近づいていない可能性もあります。



また、Googleが最近の月にスキャンされた映画をインデックスに追加するかどうかも不明です。 事実、出版社は、フィルムが迅速にスキャンされて返送されたが、非常に長い期間インデックスに追加されたため、大量のスキャン済みの未処理の情報が「スタック」に蓄積したと報告した。



All Articles