
Googleリーダーは2005年に登場しました。 1〜2年後、私はそれを主要な情報源として使用し始めました。 そして、突然、ここで、利益を得ず、プロフィールではなく、近くに... ...その結果、第一に、彼らは高度な(オタク)忠実な視聴者を失い、第二に、これらのオタクはすぐにさまざまな代替を書き始めました。 セグメンテーションが強化され、選択の問題があり、一般的に、 一部の人々は腹を立てました ...
この間ずっと、私は約30のサブスクリプションを蓄積してきました。これを定期的に読み、今後も継続する予定です。 ブログの公式勧告では 、 Google Takeoutサービスを使用して、サブスクリプションとブックマークをファイルにアップロードすることを推奨しています。
降りて行きました。 私は代替案(1、2、3、4)を探しました。 見つかりました、ダウンロードしました。 すぐに問題:
- 限られたストーリーの深さ
- スター付きアイテムのインポートがどこでも機能しない
- サブスクリプションによって参照されるブログまたは記事の一部は、長い間オフラインになっています
ストーリーを完全にし、死んだブログの投稿を保存するために、Googleリーダー(RSSフィードにあるすべて)から全文記事をダウンロードするためのツールに負担をかけて書かなければなりませんでした。 定期的に戻る記事がありますが、instapaper / scrapbook / evernoteに保存する習慣はありません。 さらに、私は頻繁に(HackerNewsのような)わずかなストリームからフルテキストRSSを作成するサービスを使用しました。この点で、私の購読はリーダーで非常に読みやすくなっています。
Reader APIを使用するために、Python用のドキュメントといくつかの モジュールがあり ます (申し訳ありませんが、他の言語は見ていません)。 これらのうち、すぐにlibgreaderを使用でき、残りは読みません。 結果は、Githubのfetch-google-readerプロジェクトです。
1.インストール(できればvirtualenvに加えて、Python <2.7の場合は、argparseモジュールも必要です):
pip install git+git://github.com/max-arnold/fetch-google-reader.git curl -s -k https://raw.github.com/max-arnold/fetch-google-reader/master/requirements.txt | xargs -n 1 pip install
2.記事を保存するディレクトリを作成します。
mkdir rss-backup cd rss-backup
3. RSSサブスクリプションのリストを受け取ります。
fetch-greader.py -u YOUR-USERNAME@gmail.com -p YOUR-PASSWORD * Please specify feed number (-f, --feed) to fetch: * [0] Atomized [1] Both Sides of the Table [2] Hacker News [3] Signal vs. Noise [4] : /
目的のものを選択して、ダウンロードを開始します。
fetch-greader.py -u YOUR-USERNAME@gmail.com -p YOUR-PASSWORD -f 0 * Output directory: atomized * ---> atomized/2011-05-24-i-hate-google-everything/index.html ---> atomized/2011-01-19-toggle-between-root-non-root-in-emacs-with-tramp/index.html ---> atomized/2010-10-19-ipad/index.html ---> atomized/2010-09-01-im-not-going-back/index.html ---> atomized/2010-08-31-they-cant-go-back/index.html ---> atomized/2010-08-28-a-hudson-github-build-process-that-works/index.html ---> atomized/2010-08-18-frame-tiling-and-centering-in-emacs/index.html ---> atomized/2010-08-17-scratch-buffers-for-emacs/index.html ---> atomized/2010-07-01-reading-apress-pdf-ebooks-on-an-ipad/index.html
デフォルトでは、選択したストリームからすべての記事がダウンロードされますが、-starredスイッチを追加することにより、マークされた記事に制限することができます。 また、-dirキーを使用して、ファイルを保存するディレクトリを個別に指定できます。
RSSフィードは、ストリームの名前から取得した名前(ラテン語に変換)でディレクトリに保存されます。 各記事は、記事の日付とタイトルから取得した名前で、個別のディレクトリに保存されます。 これは、追加のメタデータまたは写真をそこに保存できるようにするために行われます。 現時点では、写真は保存されません このユーティリティは、オフラインではなくなったブログ向けに設計されていますが、完成を妨げるものは何もありません。
聴衆への質問
RSSフィード履歴の深さを制限しない(つまり、これまでにダウンロードしたものすべてを保存する)フルテキストコンテンツを永遠にキャッシュする既存の選択肢はどれですか? また、念のため、APIまたはエクスポートを使用して、カードが再び間違った場合にこれらすべてをコンピューターにプルできるようにしますか?
PS写真© mashable.com