将来的には、Habrahabrで公開される拡張アナウンスに依存します。 この発表で見つけたこれらの矛盾と論理的な不正確さを分析します。
デブリーフィング
「家に正確な予測」そのような予測が必要ですか? 既存のコンピューターモデルは、20 x 20キロメートルまたは15 x 15キロメートルのグリッドを使用します。 これはどういう意味ですか? これは、前のノードからの各決済ノードが20キロメートルの距離にあることを意味します。 原則として、標高差が小さい平坦な地形の場合、これで十分です。 しかし、山岳地帯では、設計ノードがより近い距離にある中規模モデルの助けが必要です。 ほとんどの場合、5、2、または1キロメートルです。 しかし、例外があります。 たとえば、100メートルのグリッドを持つメソスケールモデルCOSMOは、2014年のソチオリンピック専用に開発されました! もちろん、そのようなモデルは、霧、地形性降水量、温度の急激な変化など、特定の地域に固有の局所現象をうまく計算します。 しかし、ご覧のとおり、ここでも100メートルの精度のグリッドが使用されています。 そしてそれは正当化されます。 実際、ノードの数が増えると、モデルを実行するスーパーコンピューターの負荷が増大します。 しかし、あなたは家に正確さが必要ですか? 場合によっては、気団が非常に均一であるため、温度が10、20、または50キロメートルごとに1度変化します! 家に正確な予測は、広告のダックではありません。
1月2日の夜の中央連邦地区の最低気温
「大気のグローバルな状態に関するより詳細な情報は、世界で最も正確なグローバルモデルの1つと考えられ、0.25度の解像度を持つAmerican Global Forecast Systemモデルから得られます。」
明確化が必要な別のステートメント。 アメリカのコンピューターモデルGFSは本当に優れていますが、最も正確ではありません。 欧州のECMWFモデルは、最も正確なモデルです。 アメリカのサイトであるWeatherbell.comは、最大5日間の2つのモデルについて、予測されたバリックフィールドと実際のバリックフィールドとの対応のグラフを提供します。 2015年のヨーロッパモデルの対応係数は0.910で、アメリカモデルの対応係数は0.885です。 バリックフィールドの予測は、基本的なパラメーターです。 モデルが適切に計算すれば、温度、風、曇り、降水量も適切に計算できます。
アメリカおよびヨーロッパのモデルにおけるバリックフィールドの予測品質の分析。
精度評価
真実の瞬間が来ました。 次に、実験の条件について少し説明します。 予測の精度を評価するための基準に精通しています。 私のサイト「Weather 45」では、3年間、クルガンの自分の都市の予測を編集しています。 私はマルチモデルアンサンブルテクニックを使用します。予測は、1年の異なる時期に、異なる総観の状況で「オン」になっている多数の異なるモデルに基づいています。 2014年には、1日の気温予報が95%の正確であることが判明し、2015年には1%の精度向上が可能になりました! 私の予測は、地元の天気予報士よりも10%正確で、85%が上のバーです。 単一のサービスではなく、単一の独立したモデルでも、私よりも正確に予測を行うことができませんでした。 複数のアプローチは、単一モデルの予測よりも高い効率を示します。
12月中毎日、Yandex、Foreka、および自分の予報を書き留めました。 日中の最高気温と夜間の最低気温の予測。 これは世界的な慣行であり、新しいことは何もありません。 彼は、正当化をパーセントで、平均絶対誤差を度で分析しました。 正当性を評価するために、水文気象センターのガイダンスを使用しました。 ここにあります 。
おわりに
実験の結果は私に期待されていました。 Yandexの予測はForekaの予測より2%正確であり、平均絶対誤差はほぼ等しいことが判明しました。 これは、平均的なユーザーがこれらの2%を感じることさえないことを意味します。 そして、もちろん、YandexはWeather 45 Webサイトで公開されている私の予測を上回ることはできませんでした。 さらに、私の観察中に、Yandexは夜間の冷却を予測できないことに気付きました。これは、冬季の主な問題です。 別の問題点は、サイト自体とアプリケーションに関係していました。 12月中旬以降、Yandexは技術的な不具合に起因する可能性のある最も不適切な予測を発行し始めました。 たとえば、大Year日には、ほとんどのモデルで-30へのコールドスナップが予想されました。 また、Yandexは-21のみを示しました。 これは許されない間違いです! 35%の優位性についてもコメントしません。
Yandex Webサイトのグリッチ。 コールドスナップはありません。 大New日は-33でした。 Yandexは-21を示しています。
最終的に、Yandexは超自然的なものを作成しなかったと言えます。予測の客観的な分析は、誤差の範囲内でのみForeca Webサイトの予測に対する優位性を示したため、一般ユーザーはこの違いを感じることができません。 そして、違いがなければ、なぜもっと払うのですか?