誰の天気予報がより正確ですか?

多くの人々は時々考えます-天気予報はどれくらい正確ですか? 誰の天気予報がより正確ですか? 私の都市の予測はどの方向に最もよくミスをしますか?



数学の冒険の時間!









過去数年にわたり、Yandexは気象サービスを積極的に開発してきました。 数年前、 Metiumテクノロジーが導入さ、降水量予測は数分単位で正確になりました。



これらの出版物の議論では、 fantast8のコメントが際立っていました。 アマチュア気象学者はYandexの技術をかなり積極的に攻撃しました。コミュニケーションスタイルに注意を払わなかった場合、苦情の本質はテクスチャの欠如と閉じた統計値でした。



そして、私は思った:誰も予測の精度を考慮していますか?



火の王国



ForecastAdvisorプロジェクトは迅速なグーグルを提供しましたが、予測は米国の都市についてのみ推定され、もちろん、ロシア語のプロバイダー(Yandex、Hydrometなど)はありませんでした。



RuNetでは、しばらくの間MyCli.meプロジェクトがありましたが、現在は閉じられています。 しかし、彼はデータ収集に関する永続的な問題を抱えており、評価システム(最良の予測の選択)は科学的手法に基づいていませんでした。



さらに、 OLSluciusなど、多くのイニシアチブを見つけましたが、それらはすべて、時間内、都市内、またはプロバイダー内で制限されていました。 たとえば、 slimyhorrorの最も素晴らしいプロジェクトの1つは、5,000日以上連続して予測予測を分析していることです! ただし、BBCからの予測のみが評価され、英国の都市についてのみ評価されます。



したがって、独自のプロジェクトを行うことが決定されました。 ポイントは小さい-予測を収集し、実際の天気を収集し、科学的に基づいた式に基づいて市場性を評価すること。 彼女から始めましょう。



バナナガード



2009年、ロシアの水文気象センターは「短期予測マニュアル」を発行しました。 このマニュアルによると、予測は、実際の観測温度とどの方向でも3°C以下しか異ならない場合に満たされると見なされます。 予報が実際の天気と3°以上異なる場合、そのような予報は満たされていないと見なされます(マニュアルの7.3.1.4項)。



卒業についての詳細。
理論的には、プロバイダーは毎日-60〜+60の天気を予測できるため、100%の市場性を得ることができます。 ただし、予測の正確なグラデーションは、「日中の気温が2°から4°」など、1度以下の偏差と見なされます。 したがって、間隔から2度、または値から3度の偏差が許可されます。


天気予報は、昼と夜で別々に推定する必要があります(7.2.3)。 毎日の予測の実行可能性は、夜間とその日の予測の実行可能性の値の平均として決定されます。 カレンダー期間(月、季節、年など)の天気予報の成功の評価は、対応する期間(9.1.1)の平均正当化の計算にあります。



さて、難しいことではないようです-明日(明後日など)の予報を取り、実際の天気に関するデータを収集し、昼と夜で別々に比較します。 もし



Math.abs(predict - actual) > 3
      
      





予測が成立しなかった(Pt = 0%)、3以下の場合、Pt = 100%。 対応する期間の平均的な正当性を考慮し、必要なデータを取得します。



暗い雲



天気のあるサイトの解析をすぐに拒否しました。 HTML解析は安定していないため、最終的な統計のエラー数が必然的に増加します。 幸いなことに、多くのプロバイダーは、予測にアクセスするためのAPIを提供しています。 最初のステップでは、accuweather.com、darksky.net、openweathermap.org、wunderground.comからの予測を追加しました。 それらはすべてJSON APIを提供します。 第2段階では、XML-APIを使用したノルウェーのyr.no、ロシア水文気象センター(RSSを解析する必要がありました)、およびYandex.Weatherが追加されました。



現在までに、foreca.comとの合意があり、gismeteo.ru、intellicast.com、および英語のmetofficeとの交渉が進行中です。 これらのプロジェクトにAPIを支援する準備ができている友人がいる場合は、書いてください!



奇妙さの増加



理論的には、実際の天気の収集では、問題はないはずです。 すべての主要都市には気象監視ステーションがあり、通常はモスクワの中心部にあり、たとえばモスクワではVDNKhです。 国家水文気象サービスは、これらのステーションからWorld Weather Watchにデータを送信し、そこで処理および保存します。 観測は、3〜6時間ごとにSYNOPコードとして送信されます。



さらに、すべての主要空港に気象監視ステーションがあり、METAR形式の気象レポートを1時間ごと(または30分ごと)に送信します。



生のSYNOPおよびMETARデータはNOAA Webサイトにあります。 ogimet.comで処理されたデータ。 ステーション自体は、weatherobs.comで簡単に検索できます。



ただし、いくつかの問題があります。 まず、送信されたデータの品質-タイプミスは、ブリテンで誤って印刷されることがよくあります(たとえば、数字の0ではなく文字O)。 第二に、データの安定性。 2017年、Aviamettelecomは1か月間にわたって、50を超えるロシアの空港から国際取引所への気象レポートの転送を停止しました。 第三に、稼働中の駅を見つけることができなかった都市があります。 たとえば、ロストフオンドンでは、ステーション34730(URRR)またはステーション34731のいずれにもデータはありません。



そのような状況では、 The Weather Company (現在はIBMが所有)のプライベートネットワークの情報を使用して、実際の天気を収集します。



科学のルール



結果はMeteotrust.comサイトです

現時点では、ロシアの10都市について7つのプロバイダーからデータが収集されています。 近い将来、より多くの都市、より多くのプロバイダー、より多くの期間を追加する予定です(hydrometcenterとaccuweatherからの長期予測、10日間の予測)。 さらに、降水統計の収集が準備されています。 降水予報の精度の推定は、温度よりも少し複雑です。 これは別の投稿になります。



調査結果は何ですか?



Openweathermap-下。

Accuweather、yr.no、darksky-強いミドル農民。

YandexとWundergroundの予測は優れています。

気象センターは、短期予報の質において1位を獲得するために、Yandexとしばしば戦います。 ただし、都市、特に外国の都市の数が増えると、水文気象センターの予測の全体的な成功率が低下するという仮定があります。



All Articles