SQL構文に関するTwitter APIのリクエスト

TweeQLクエリ言語はSQL構文に基づいてモデル化されており、ツイートデータベースをリレーショナルデータベースと同じくらい簡単に操作できます。



TweeQLの構文は次のとおりです。



SELECT field1, field2 FROM streams WHERE filter_conditions GROUP BY field3, field4 WINDOW x seconds
      
      





たとえば、次のようなクエリ



 SELECT text FROM twitter_sample WHERE text contains 'bobuk';
      
      





ツイートのストリームから、「bobuk」に言及するフラグメントを取得します(bobukは、Runet上のTwitter APIの最もアクティブなユーザーとしての例のためだけにここにあります)。



これはすべて、正しいAPIリクエストのすべての詳細を考慮する必要はありません。



TWITTER_SAMPLEは、総数の約1%を含むツイートのストリームです。 一般ストリームにリクエストを行う必要がある場合は、データソースとしてTWITTERを指定します。



フィルターされたツイートは、ローカルディスク上のデータベースに保存できます(そのパラメーターはsettings.pyで設定されます)。 パフォーマンス上の理由から、データベースへの書き込みは1000レコードに達した場合にのみ可能であるため、フィルター処理されたレコードが少ない場合、それらは保存されません。



TweeQLはPythonでエンコードされています。



All Articles