新機能へ:
- rssおよびatomストリームのサポート(Googleリーダーで共有エントリをサブスクライブできるようになりました);
- 通常のhtmlページをソースとして示すことができます(これで、さまざまなリソースから好きな資料を収集して、本に入れることができます)。
- fb2形式での印刷のサポート(これまではテキストのみでしたが、次のリリースでは画像がサポートされる予定です。fb2の印刷プレビューも不十分です)。
- 更新をダウンロードするためのスケジューラー(デフォルトではオフです。再起動中の設定はこのリリースでは保存されません);
- ページパーサーテンプレートに新しいフィールドclear.tagsが追加されました。
- txtファイルからソースリンクをインポートします(新しい行は新しいリンクですが、独自の本を作成したい人には便利です)。
- ページコンテンツの取得に関するいくつかのエラーを修正しました。
将来の計画では、アプリケーションの最適化(現在、多数のソースで非常に長いダウンロードと印刷が行われています)、バグ修正、ユーザビリティの向上、ローカライズ。
次のリリースに新しい機能を追加する予定はありません
ここからダウンロードできます。WindowsおよびLinux用のアセンブリがあります。 現在のバージョン1.1。
すべてがいつものように無料でオープンソースですが、あなたが私に感謝したいなら、私は拒否しません
- バグのあるレポートをテストしたり送信したり、ここにコメントを追加したり、プロジェクトのバグトラッカーで(はるかに優れています)
- 同じスタイルで設計された元のアイコンとスプラッシュ画面。
- アプリケーションのローカライズを支援します(興味のある方のために、後でお知らせし、テストバージョンを提供します)。
- ドキュメントとヘルプの作成の支援、およびそれらのさらなるローカリゼーション;
- LinuxディストリビューションのアセンブリパッケージとWindowsのインストーラー。
- 謙虚な寄付;)
更新しました。 1 Linux向けビルドの起動に問題がある場合は、おそらく古いQtライブラリがインストールされています。
起動時のエラー:セグメンテーションエラー。
ライブラリを更新するには、qt-sdkをダウンロードし、環境変数LD_LIBRARY_PATHのパスをqt / libに書き込みます。
または、新しいパッケージでリポジトリを追加します。
たとえば、Ubuntu 9.10の場合は、sudo add-apt-repository ppa:bausparfuchs / qt4.6-releaseを実行します(別のバージョンのUbuntuがある場合は、リンクをクリックしてください)。
更新しました。 2ページを解析するための独自のルールを追加する例。 ( mytherの要求どおり )。
forums.goha.ruフォーラムからの投稿を読みたいとします。
page-templatesフォルダーで、新しいforums-goha.propertiesファイルを作成します(名前は何でも構いませんが、ファイル拡張子のみが重要です)。
ファイルに最初のフィールドを追加します
rss.host = forums.goha.ru(rss.host-サイトアドレス)
次に、コンテンツを認識したいフォーラムスレッドを開きます。 たとえば、 forums.goha.ru / showthread.php?t = 388919です。
ブラウザで、ページのソースを選択して表示します。
次に、関心のあるコンテンツが配置されているタグを見つけます。タグは一意であることが望ましいです。 私たちの場合、すべてのコンテンツは<div id = "posts">と</ div>の間にあり、その中にはいくつかのネストされたdivタグもあり、その数は確かに言えません。したがって、そのようなテンプレートは正しくありません。 しかし、コンテンツでdivを閉じるとすぐに、新しい一意のタグが開きます。これには<div id = "lastpost">を使用します。 したがって、content.patternは次のようになります。
content.pattern = <div id = \ "posts \">(。*)<div id = \ "lastpost \">
\文字は二重引用符をエスケープし、組み合わせ(。*)は任意の数量の任意の文字を意味します。
その結果、パーサーは指定されたタグ間のコンテンツを取得します。タグ自体は、最後のタグが開かれ、削除する必要があるため、あまりよくありません。 非常に簡単なことは、この行をファイルに追加するだけです
clear.tags = <div id = \ "lastpost \">
複数のタグを削除する必要がある場合は、セミコロンで区切ってリストすることができます。例えば
clear.tags = <div id = \ "lastpost \">; <a id=\ needlastpost\>>; <b id = \ "lastpost \">
最後のフィールド
clear.htmlは2つの値(trueまたはfalse)のみを取り、テキスト内のすべてのhtmlタグの削除をオンまたはオフにします。 これまでのところ、私たちはしようとします
clear.html = false
つまり、テキスト内のタグは削除しません。
したがって、次の内容のファイルを取得します。
rss.host=forums.goha.ru
content.pattern=<div id=\"posts\">(.*)<div id=\"lastpost\">
clear.tags=<div id=\"lastpost\">
clear.html=false