時系列予測

こんにちは

私は、その時代に本当に興味を持った1つの問題、つまり時系列を予測し、antアルゴリズム法を使用してこの問題を解決する問題についてお話したいと思います。



最初に、問題の簡単な要約とアルゴリズム自体:





時系列の予測は、時系列の最初のnポイントにおける特定の関数の値が既知であることを意味します。 この情報を使用して、時系列のn + 1ポイントの値を予測する必要があります。 さまざまな予測方法がありますが、今日ではウィンターズ法とARIMAモデルが最も一般的です。 それらの詳細については、 こちらをご覧ください



antアルゴリズムが何であるかについては、すでに多くのことが言われています。 たとえば、 ここを登るのが面倒な人のために、もう一度言います。 要するに、アリのアルゴリズムは、食物源への最短経路を見つけるためのアリのコロニーの行動のシミュレーションです。 アリは、移動するときにフェロモンの跡を残します。これは、アリが特定の経路を選択する確率に影響します。 アリが同じ期間にもっと短い時間を何度も行くことを考えると、より多くのフェロモンがその上に残ります。 したがって、時間の経過とともに、ますます多くのアリが食物源への最短経路を選択します。

わかりやすくするために、写真を挿入します。



画像



ここで、アリコロニー法を使用して予測問題の解決に直接進みます。

最初に直面する問題は、antアルゴリズムを実行するグ​​ラフの形式で時系列を提示する必要があることです。

次の2つの解決策が見つかりました。

1.時系列の各ポイントから特定のゲインの各セットに移動できるマルチグラフの形式で時系列を提示します。 (タスクを容易にするために、-1から1の間隔で正規化された値を取得します)。 これが私たちが試みた最初のアプローチでした。 彼は小さな次元の時系列で良い結果を示しましたが、次元が増えると、予測の精度と生産性の両方が急激に低下し始めたため、このオプションは廃止されました。

2.一連の連結グラフの形式で時系列を提示します。各グラフは、時系列の値の増加の値を担当します。 つまり、-1から-0.9 ...などの1の増加に関与するグラフがあります。もちろん、このステップは減少または増加する可能性があり、予測の精度とタスクのリソース消費に影響します(最終的に、このオプションが最も成功しました)



この連結グラフのセットでは、antアルゴリズムが(各グラフ自体で)実行され、時系列の既知の値に対応するエッジでフェロモンがレイオフされました。 さらに、フェロモンが列iに堆積した場合、フェロモンは列i-1およびi + 1にも堆積しましたが、はるかに少ない量(この場合、フェロモンの基本量の1/10)であったため、アリは一時的な値で最も頻繁に発生する成長シーケンスを分離しましたそして、隣接するグラフ上のフェロモンの延期により、時系列の起こりうるエラーと初期ノイズが平準化されました。



このアルゴリズムを、さまざまなレベルの周波数とノイズで人工的に準備された時系列でテストしました。 結果は2つありました。 一方、最大0.3のノイズレベルでは、アルゴリズムはARIMAモデルの結果に匹敵する高い予測結果を示します。 ノイズレベルが高いと、結果のばらつきが大きくなります。予測は非常に正確であるか、完全に不正確です。



現在、アルゴリズムパラメータの最適値の選択と、それを改善するためのいくつかの方法に取り組んでいます。十分にテストされ次第、これについて説明します。



ご清聴ありがとうございました。



Upd:あなたの質問に答えようとします。

マルチグラフは、各頂点がそれぞれに接続されているグラフです。



既に説明したように、カオスシリーズはランダムではありません。 3次元空間でローレンツシリーズの画像を見て、周期的な動きを見ることができます。 このサイクルを簡単に判断することは難しく、一見するとシリーズがランダムに見えます。



時系列の値は、間隔-1 ... 1で正規化され、グラフに書き込まれます。 グラフ-この場合、上から上への遷移表。 フェロモンは、エッジ(テーブルセル内)に堆積します。



連結グラフの場合、いくつかのテーブルが使用されます。各テーブルは、独自の遷移値のみを担当します。



セルのフェロモンの量に応じて、予測の結果として時系列の値が選択されます。



アルゴリズムは、主に一連のローレンツでテストされました。



現時点では、どれだけ良いか悪いかを言うのは時期尚早です。 アルゴリズムは擬似周期を見つける傾向があり、ノイズレベルが増加すると、偽周期の数が増加するようです。

一方、パラメータの選択が成功すると、予測の精度は非常に高くなります(最大7〜10%の偏差で、カオスシリーズにとっては悪くありません)。



後で実際のデータのテストに進みます。 私は、近い将来に写真を準備して追加しようとします。



ご清聴ありがとうございました。



All Articles