休暇 どこ? いつ? R

画像 窓の外では気温が次の記録に向かっていますが、過去数十年にわたって世界中の30,000ポイントで任意の時間間隔でどのような気温があったかを見るのは興味深いです。 そして、休暇の日は悪くないかもしれませんし、暖かい天気や寒い天気のために選択した場所にある種の「統計上の利点」がある日にそれらを利用して、3種類の図のいずれかで視覚的に評価します。 さて、または単に地球を回転させて、さまざまな温度と「この世界の美しさ」を視覚的に評価することができます。





データ収集



データソースは世界中にある気象観測所からのデータであり、その結果は国立海洋大気庁(NOAA )にも提供されています。そのウェブサイトには、1901年からのこれらの観測所の測定値のアーカイブがあります(この期間中に30,000を超えるステーションが存在し、現在は約14,000の実際のステーションがあります。データへのアクセスはftpを介して行われ、多くの異なるデータがあります 温度、湿度、降水量、風などによって異なります)、1日の平均気温のデータのみを使用します。

各ステーションの各年のデータは、区切り文字付きのアーカイブテキストファイルです。 このリソース上のファイルの合計数は約700,000で、すべてダウンロードできます。おおよそのダウンロード時間は約2日で、約200 GBのディスクスペースが必要になりますが、データのダウンロード時間は1ユニットなので1年に1ステーション)は0.2秒未満です。そのため、リクエストの大部分(5〜10ステーションで5〜10ステーション)の待機時間は1分以下なので、アクセスはオンラインです。 各ステーションには、シノプティックインデックス(一意のコード)、名前、および座標があります。 残念ながら、駅の名前は必ずしも有益ではありませんが、ほとんどの場合、最も近い集落であり、他の場合は空港の近くにあります。 最近、多くの駅が閉鎖された、またはその逆が始まっていたため、数年間はギャップがあるかもしれません。 対象の時間間隔を選択した後、指定された範囲に対して選択が行われ、図がプロットされ、平均化されたデータが地球儀と地図に表示されます。



グローブと地図に表示



threejsパッケージは、回転するグローブにデータを表示するために使用されます。 レンダリングには、グラフィック形式( jpegファイル(楕円体WGS84の地理的投影))を使用するか、オブジェクトを生成することができます。 この場合、既製のjpegファイルが使用されます。これは、2004年8月 NASA WebサイトからのBlue Marble Next Generationデータセットの地球表面のランドスケープカバーです(ピクセルあたり8 kmの解像度)。 その結果、1つのパラメーターをグローブに表示できるため、平均(中央値)温度が(年および日間隔の両方で)表示されます。 特定のポイントの地球儀では、特定の色、高さ、厚さの列が表示されます。私の場合、これらのパラメーターはすべて、選択したすべての測点に関する対象期間全体のすべての年の平均気温を表示するために使用され、列サイズと青色からの色の遷移の場合はスケーリングが使用されます温度が赤の場合(つまり、平均気温(-10°、-5°、+ 7°、+ 10°、+ 30°)のステーションの場合)最小の高さと厚さの青いバーは、-10°の気象ステーションの場合、赤いバーと 最大送り高さ+ 30°に気象ステーションの厚さ、及びこれらの極値に対して計算割合の残りの局のサイズや色)。

これらのバーに加えて、1つのポイント(モスクワ)からの曲線も示され、選択したステーションへの軌跡を示し、これらの曲線の太さと色も温度に対してスケーリングされます。 これらの曲線の表示は、距離と平均温度の両方を明確に示しています。 また、地球上のデータ(回転および拡大可能)に加えて、この情報(平均温度、距離、使用色)が隣の表に示されています(図1)。 また、地球に加えて、同じ平均データがフラットなGoogleマップ([ マップ ]タブ)に表示されます。



チャート、静的およびインタラクティブ



グラフィカルなWebインターフェースは、伝統的に迷惑で便利な光沢のあるダッシュボードインターフェースであり、スクリーンショットでわかるように、サイドパネルでパラメーターが選択され、メインパネルでタブ付きパネルが使用されます。

画像

図 1.メインウィンドウ



最初のタブ(地球上)のデータ(平均化されており、追加情報を持たない)に加えて、年と相互の両方の温度の広がりと動態を見るのがより興味深いです。このため、すべてのパネル図が使用されます。 :

- 時系列(図2) -通常の時系列、各パネル(気象観測所)でアーカイブされた年は色で色付けされ、黒の太字曲線はこれらの年で平均されます(図は対話型の図を示し、凡例は過去の温度で並べ替えられます) )毎日)

画像

図2。 時系列チャート



- ボックスプロット、スパンチャート(図3) -この場合、毎日がアトミックと見なされ、このチャートは選択したすべての年の特定の日付の値の広がりを表示します

画像

図3 スイングチャート(ボックススプロット、ヒゲ付きボックス)



- 密度(図4) -選択したステーションの温度密度の図。パネルに年が既に示されており、ステーションの温度比と時間のダイナミクス単位)を明確に示しています。

画像

図4 密度チャート



ggplot2静的ダイアグラムに加えて、 「インタラクティブダイアグラム」チェックボックスをオンにすると、ダイアグラムがインタラクティブダイアグラムに変換され、ホバリング時に凡例を表示し、ダイアグラム自体を拡大、縮小、または移動できます。 これを行うには、 plotlyパッケージを使用して、既存のggplot2オブジェクトを直接対話型表示に変換します。



保存中



すべての結果を保存するために、すべてのダイアグラム、テーブルをHTMLおよび/またはdocx形式でアンロードできます([ レポート ]タブ)。 これを行うには、必要な形式を選択してファイルを保存します。 これはmarkdownとの統合を使用します。このため、プレーンテキストとR関数呼び出しの両方を表示するRmarkdownモックアップファイルを使用します



おわりに



その結果、最適な休暇日を選択する際に「統計的優位性」を得たいという願望のために、世界のほぼあらゆる場所のあらゆる日間隔の過去の気温を調べ、地球温暖化の有無を評価できるツールを手に入れました。 従来、Rのおかげで、これらはすべて迅速かつ簡単に実装されていました。



All Articles