Yandexは冬の降雨をどのくらい正確に予測しますか? 予測サービスの精度を分析します

11月に、 「Yandex.Meteum-technology without technology。」という記事を公開しました 地区に正確なマーケティング '' 、Yandex予測の品質を他のサービスと関連付けました。 他のパラメーターを分析することなく、温度に重点が置かれました。 結論は、Yandexの気温予報は、すでに実績のある予報サービスと比較して例外的な結果を示さないということでした。 全文を読むことをお勧めします。 今回は、もう1つの重要なパラメーターである降水量を確認します。



画像



検証条件と制御予測



この研究の主な目標は、他の予測サービスと比較して、Yandex降水量の予測の質を理解することです。 降水相やその量ではなく、現象の予測に重点が置かれているという事実に注目します。



コントロールの予測として、1月にwundegroundサービス統合されたintellicast.comのデータを使用しましたが、これは予測に影響を与えず、インターフェイスのみが変更されました。 2番目の制御予測は、ロシア水文気象センターの方法論室のウェブサイトからの包括的な予測です。 以前の出版物でこの予測について話しました。



予測は手動で傍受されました。 評価期間は気象日、つまり午前8時から9時から20時から21時です。 私は夜の降水を考慮しませんでした。 予測は、2018年11月3日から2019年3月31日まで、つまり、気候の冬がロシアのヨーロッパ部分とウラルの一部に降る期間について推定され、対流の影響はありません。



Yandexの予測も日中にのみキャプチャされました。 同時に、サイトからの予測を、アリスがプッシュ通知で送信した予測と相関させようとしました。 後で、予測が互いに一致しないことが判明しましたが、これについては後で説明します。



都市は、私がウラルの南の一部とロシアのヨーロッパ領土の主要部分を占領できるように選ばれました。 クルガンからモスクワまで線を引き、ほぼ同じ間隔でこのサイトの都市を選択しました。 これらはクルガン、ウファ、カザン、モスクワです。 ポイント間の平均距離は591 kmです。



Roshydrometが72時間までの予報を推定するために使用する短距離一般気象予報に関するマニュアルは、評価手法として使用されました。 先ほど言ったように、降水量や相ではなく、降水の事実を評価することが重要でした。 そのため、テーブルに2つのパラメーターを入力しました。乾燥(降水なし)または降水です。



サイトが1日の任意の時間に降水量を予測した場合、予測にはグラデーション「降水量」が表示され、予測に降水量がなかった場合は「乾燥」が表示されます。



Roshydrometステーションの公式ランクは、事実情報として使用されました。 気象観測所で、降水量計が12時間で少なくとも0.1 mmを記録した場合、ステータス「降水量」がテーブルに入力されました。 さらに、予後と実際のグラデーションは相関していた。 研究で使用された気象観測所の数を示します:28661(クルガン)、28722(ウファ)、27595(カザン)、27612(モスクワ、VDNKh)。



たとえば、Yandexは日中に小雪を予測し、気象観測所は記録しないため、予測は0%に設定されます。 降水量がある場合は、100%。 したがって、すべての予測は、同等の評価条件に置かれました。



透過性のために、すべてのデータを含むソーステーブルへのリンク公開します 。 また、予測を評価するだけでなく、リードタイムがゼロの総観マップと相関させることも試みました。これにより、Yandexが正当化の結果が最も低い総観的状況を特定できました。



調査結果



当初、Yandexは他のサイトと同様の結果を示すか、競合他社のレベルをわずかに下回ると仮定しました。 11月末、Yandexの精度はコインを投げることに匹敵することが判明したこの仮説に別れを告げなければなりませんでした。 結果はランダムな予測レベルで、50〜60%の範囲でした。

5か月間、24時間降水量のYandex精度は58%でした。 Intellicast / wundergroundは81%で、水文気象センターの統合予測は80%です!



画像



Yandexは興味深い機能を発見しました-モスクワから遠ざかるほど精度が低下しました。 クルガンでは、平均精度は45.6%、モスクワでは67.8%でした。 競合他社の予測は75%から85%の範囲で、これは冬のシーズンには非常に適切です。



画像



冬のYandexの主な問題は、誤った降雨です。 Yandexは降水量を予測しますが、他のサービスは典型的な状況である乾燥した天候を期待します。 最も悲しいことは、Yandexが、高気圧が存在する領域でも降水量を予測することです。 たとえば、11月12日、Yandexは1日を通してカザンの降雨を予測しましたが、高気圧の中心がこの地域を通過し、晴天で物理的な降雨がないため、降雨はありません。



画像



同様の状況が12月20日に繰り返されましたが、クルガンで発生しました。 再び、都市上空に高気圧が確立されましたが、Yandexはしつこく降水量を出しました。 そのような奇妙な状況はたくさんありました。最も鮮明な例を挙げました。



画像



別の問題は、アリスとプッシュ通知であり、メインのYandexアプリケーションを介して送信されることが判明しました。 たとえば、1月3日、ウェブサイトは1月4日は雨が降らないと書いており、アリスは私に次のように送った。 明日は少し雪。」 5か月間、このようなケースはごくわずかしかありませんでしたが、サービス間で意見が一致しないという事実は異なる考えにつながります。



画像



もちろん、ほとんどの場合、アリスはサイトにリストされたものと同じ予報を報告しましたが、降水はありませんでした。 Meteumのエラーは、他のすべてのサービスの作業に変換されるため、何かを行う必要があります。



気候データ



24時間の降水量予測を計算しましたが、Yandexに存在する別の重要な問題の概要を説明します。 天気。」

前の記事で、Yandexがすべての都市の平均月間降雨量を公開していることをすでに書いています。 問題はデータソースです。 このサイトはNOAAのソースを示しており、Yandexはアメリカのコンピューター再解析CFSRのデータを使用していると推測できます。 再分析は温度研究には適していますが、降水量の研究には非常に貧弱です。 コンピュータモデルは、特に低強度の実際の降水量を再現しません。 気象観測所の降水メーターは実際の降水量を記録し、コンピューター(再分析)が仮想を計算します。 このため、エラーが発生する場合があります。



この違いは夏に特に顕著になり、対流プロセスが開始され、モデルはそれらと非常に貧弱な友人です。 前面降水量は、雷雨セル(雷雲)を通過した後の降水量よりもはるかに簡単に計算できます。 誤差は、山岳地帯または海洋性気候で増加します。 したがって、気候を研究するときは、最寄りの気象観測所からのデータのみに頼ることをお勧めします。 コンピューターの再分析は、単にアナログデータがない場合にのみ使用する必要があります。



画像



たとえば、Yandex Ufaの年間降水量は803 mmですが、実際には年間降水量は586 mmです。 Yandexは降雨量を37%超えました。 一方、ウラジオストクでは、ヤンデックスは降水量を40%過小評価していました。 Yandexによると、ウファはウラジオストクよりも降水量が多く、絶対に愚かです。 Yandexにこの問題について書いたが、私の訴えは無視された。 ただし、既製のアレイをステーションごとにダウンロードして処理することは、Yandexにとってはそれほど大きな問題ではないと思います。



おわりに



24時間の降水量に対するYandexの予測は、他の予測サービスに比べて品質がはるかに劣っています。 5か月間、24時間降水量のYandex精度は58%でした。 Intellicast / wundergroundは81%で、水文気象センターの統合予測は80%です! Yandexは興味深い機能を発見しました-モスクワから遠ざかるほど精度が低下しました。 クルガンでは、平均精度は45.6%、モスクワでは67.8%でした。 予報パラメータは互いに一致していません。降水は晴天の高気圧で予測されます。

Yandexの情報を基本または唯一の予測のソースとして使用することは強くお勧めしません。



画像



メイン画像:insidecorp.ru

GFSシノプティックカード-meteoweb.ru/alter/prec.php



All Articles