2年前、議会図書館の通信部長は、2006年3月からすべてのTwitterをアーカイブする計画を発表しました。 すでにその時点(2010年3月)で非常に大量でした。1日に5,500万件のメッセージがTwitterで公開され、サイトの設立以来のデータベースの合計サイズはテラバイト単位で測定されました。
しかし、彼らは花だけでした。 2012年の夏までに、Twitterのトラフィックは1日あたり4億メッセージに増え、議会図書館は約束された全文検索アーカイブを開始していませんでした。 この点で、一部は図書館員の手が届かないことを疑い始めました。 先週、 野心的なプロジェクトを静かに放棄したという噂が流れました 。 これは実際にはそうではありません。
ニーマンジャーナリズムラボのジャーナリストは、議会図書館のTwitterアーカイブプロジェクトを率いるジェニファーギャビンにインタビューしました。 彼女は、この計画が有効であり、「優秀な司書は急ぐことはない」、つまり、Twitterが機能するのと同じペースでサービスを提供するつもりはないことを保証します。
もちろん、このタスクは、当初考えられていたよりも技術的にはるかに複雑であることが判明しました。 「技術仕様の開発プロセスは現在も進行中ですが、完成に近づいています」とGavin氏は言います。 「これを公式に発表する準備ができている特定の日付を説明することはできません。」 現在、ソースデータのソート方法(キーワード、時間など)が定義されています。 開発者は、システムのユーザーインターフェースがどうあるべきかをまだ決定していません。
「昨年、私たちはTwitterから部分的に資料を受け取り始めました。 今ではほぼ毎日入手しています。 これらは非常に大量のデータです」とGavin氏は言います。 同時に、新しいツイートのアーカイブに関する6か月間の禁輸措置が適用されます。 会社との契約条件に基づき、作成されたデータベースは、非営利的な図書館内での使用と保存のみに利用可能でなければなりません。 システムは、図書館カードで登録された図書館訪問者のみが利用できます。