Yahoo! Pipesを使用したHabrahabra RSSフィードフィルタリング

こんにちは、Habrasociety様。



Yahoo! Pipesを使用したRSSフィードのフィルター処理のトピックは既に説明しました( たとえば、ここ )が、単なる人間にとってよりシンプルで手頃な方法を示したいと思います。



そのため、文字通り1週間前、Habrのすべての投稿はhabrahabr.ru/blogs/ Blog_name / Post_numberという形式でした 。 リンクの本文にブログ名が存在することで、リンクによって不要なブログを除外するだけで、興味のないエントリのテープを簡単にクリアできました





さて、春の更新後、投稿へのリンクはhabrahabr.ru/post/ Post_number /のようになりました 。 投稿は1つのハブではなく、すぐに3になります。 さて、これは非常に興味深いアプローチですが、私たちの仕事は、興味のないハブをフィルタリングする方法を学ぶことです。







Habrのフィードの1つのRSSエントリには、投稿のタイトル、著者のニックネーム、公開日、その他のデータなどの情報が含まれています。 categoryなどの記録パラメータに興味があります 。 投稿が属するハブや投稿タグなどのコンポーネントをリストすることで取得されます。このパラメーターでフィルタリングします。





そして、なぜ説明パラメータでフィルタリングできないのですか? ハブのリストもあります!

本当ですが、 説明には記事の一部含まれています。 私たちはそのような状況をシミュレートします-私はAndroidの猛烈な対戦相手ですが、同時にapploofagとして、「OS」という言葉に基づいてフィルターを設定し、目がこのOSに関するニュースを見ないようにします。 さて、今では私のテープはこの神のないOSへの言及から一掃されていますが、今ではiOSがAndroidよりも優れている理由を説明する記事がある場合、私はそれを見ません! 混乱!



そのため、有用な記事や興味深い記事を見逃すリスクを最小限に抑えるために、カテゴリパラメーターをフィルター処理します。



実際、フィルターのセットアッププロセス自体は簡単に不名誉になります。フィルターを引き出し、 ブロックと対応するリストの要素を選択します。

次にルールを作成します。

並べ替えパラメーターとしてitem.categoryを入力します。 テキストの本文を検索したら、対応するリストで[ 含む]を選択し、空のフィールドにリボンに表示したくないハブの名前を入力します。

最終規則の例: item.categoryにはAndroidが含まれitem.categoryには高性能が含まれるなど。 意味は明確だと思う



Yahoo! Pipesでどのように見えるか





最初の2日間は汗をかいて、興味のないハブのルールを作成する必要がありますが、同じ2日間の後、テープがよりきれいになったことに気付くでしょう。



Habréに登録することで、チェックボックスをクリックするだけで同じソートを実行できる場合、なぜこれがすべて必要なのでしょうか?

ここで、もちろん、好みの問題。 たとえば、Googleリーダーでフィードを読む方が便利なため、この方法を使用しました。

また、ハッキングされた記事だけでなく、すべての新しい記事を読むことも興味深いです。この方法は、登録では新しい投稿を並べ替えて読むことができますが、24時間以内に公開された投稿が表示されるため、この場合に便利です。 同意します。このアプローチでは、「新規」セクションを毎日表示する必要があり、非常に不便です。 Googleリーダー自体があなたの資料を保存し、それがあなたに都合が良いときにそれを読むとき、それははるかに便利です。



この記事が誰かに役立つことを願っています。 ご清聴ありがとうございました。



All Articles