ニュースの独自の選択。 新リリース、新機能

前のトピックで 、プログラムにいくつかの機能を追加するように頼まれたので、すぐに行きます

新機能へ:







将来の計画では、アプリケーションの最適化(現在、多数のソースで非常に長いダウンロードと印刷が行われています)、バグ修正、ユーザビリティの向上、ローカライズ。



次のリリースに新しい機能を追加する予定はありません

ここからダウンロードできます。WindowsおよびLinux用のアセンブリがあります。 現在のバージョン1.1。



すべてがいつものように無料でオープンソースですが、あなたが私に感謝したいなら、私は拒否しません





更新しました。 1 Linux向けビルドの起動に問題がある場合は、おそらく古いQtライブラリがインストールされています。

起動時のエラー:セグメンテーションエラー。

ライブラリを更新するには、qt-sdkをダウンロードし、環境変数LD_LIBRARY_PATHのパスをqt / libに書き込みます。

または、新しいパッケージでリポジトリを追加します。

たとえば、Ubuntu 9.10の場合は、sudo add-apt-repository ppa:bausparfuchs / qt4.6-releaseを実行します(別のバージョンのUbuntuがある場合は、リンクをクリックしてください)。





更新しました。 2ページを解析するための独自のルールを追加する例。 ( mytherの要求どおり )。

forums.goha.ruフォーラムからの投稿を読みたいとします。

page-templatesフォルダーで、新しいforums-goha.propertiesファイルを作成します(名前は何でも構いませんが、ファイル拡張子のみが重要です)。

ファイルに最初のフィールドを追加します

rss.host = forums.goha.ru(rss.host-サイトアドレス)

次に、コンテンツを認識したいフォーラムスレッドを開きます。 たとえば、 forums.goha.ru / showthread.php?t = 388919です。

ブラウザで、ページのソースを選択して表示します。

次に、関心のあるコンテンツが配置されているタグを見つけます。タグは一意であることが望ましいです。 私たちの場合、すべてのコンテンツは<div id = "posts">と</ div>の間にあり、その中にはいくつかのネストされたdivタグもあり、その数は確かに言えません。したがって、そのようなテンプレートは正しくありません。 しかし、コンテンツでdivを閉じるとすぐに、新しい一意のタグが開きます。これには<div id = "lastpost">を使用します。 したがって、content.patternは次のようになります。

content.pattern = <div id = \ "posts \">(。*)<div id = \ "lastpost \">

\文字は二重引用符をエスケープし、組み合わせ(。*)は任意の数量の任意の文字を意味します。

その結果、パーサーは指定されたタグ間のコンテンツを取得します。タグ自体は、最後のタグが開かれ、削除する必要があるため、あまりよくありません。 非常に簡単なことは、この行をファイルに追加するだけです

clear.tags = <div id = \ "lastpost \">

複数のタグを削除する必要がある場合は、セミコロンで区切ってリストすることができます。例えば

clear.tags = <div id = \ "lastpost \">; <a id=\ needlastpost\>>; <b id = \ "lastpost \">

最後のフィールド

clear.htmlは2つの値(trueまたはfalse)のみを取り、テキスト内のすべてのhtmlタグの削除をオンまたはオフにします。 これまでのところ、私たちはしようとします

clear.html = false

つまり、テキスト内のタグは削除しません。



したがって、次の内容のファイルを取得します。

rss.host=forums.goha.ru

content.pattern=<div id=\"posts\">(.*)<div id=\"lastpost\">

clear.tags=<div id=\"lastpost\">

clear.html=false












All Articles