連続ウェーブレット変換

こんにちは、親愛なるhabrasociety。

最近、信号と画像の分析と処理に関連する記事がハブに登場し始めました(たとえば、 永続的な画像特徴の検出:SURFメソッドBigObfuscatorからの統合画像表現 )。これに関連して、このような分析ツールについて簡単に説明します。ウェーブレット変換のような信号。



ウェーブレット分析の意味を理解するために、私たちはかなり遠くから始めます。 この記事では、ウェーブレット変換の数学的意味を(簡単な言葉で)説明します。適用可能性とその離散バージョンについては後で説明します。



スペクトル解析は、測定された信号の周波数成分を特徴付ける信号処理方法の1つです。



フーリエ変換


スペクトル解析の主な数学的基礎はフーリエ変換です 。これは、空間または時間信号(またはこの信号の何らかのモデル)を周波数領域での表現に結び付けます。

関数fのフーリエ変換は積分表現であり、次の式で与えられます。

画像

しかし、フーリエ変換は、信号に存在する周波数についての情報のみを提供し、この周波数が信号に存在する期間に関する情報を提供しません。

したがって、次の定常信号の場合:

画像

画像

フーリエ変換の形式は次のとおりです。

画像



そして、非定常信号の場合:

画像

フーリエ変換の形式は次のとおりです。

画像

したがって、2つの完全に異なる信号の場合、ほぼ同じフーリエ変換が得られます(2番目の信号のフーリエ変換グラフの滑らかさは、この信号の周波数の突然の変化によって説明されず、異なる周波数の振幅の違いは、これらの周波数が対象の異なる時間に作用したという事実によって説明されます信号セグメント)。

したがって、フーリエ変換は、本質的に定常信号と非定常信号を区別できません。これは、その適用性にとって大きな問題です。



ウィンドウフーリエ変換


別のスペクトル分析ツールは、短時間フーリエ変換です。これは、フーリエ変換のバリエーションであり、次のように定義されます。

画像

ここで、W(Tau-t)は何らかのウィンドウ関数です。

通常、ガウス、ハミングウィンドウ、ハンウィンドウ、またはカイザーウィンドウがウィンドウ関数として使用されます。



ウィンドウフーリエ変換は、通常のフーリエ変換とは対照的に、すでに時間、周波数、および振幅の関数です。 つまり、信号の周波数の特性分布(振幅あり)を時間内に取得できます。



次の非定常信号を考慮してください。

画像

この信号は250msごとに静止します(最初の250msの長いセグメントでは、周波数は300Hz、2番目-200Hz、3番目-100Hz、4番目-50Hzです)。

ウィンドウフーリエ変換の3次元(時間、周波数、および振幅)グラフの形式は次のとおりです。

画像

(グラフの対称性は、フーリエ変換(ウィンドウフーリエ変換を含む)が任意の信号に対して対称であるという事実によって説明されます)

このグラフでは、信号に存在する周波数に対応する4つの顕著な最大値を確認できます。 最も重要なことは、通常のフーリエ変換とは対照的に、時間軸に対する周波数値を取得することです。 つまり、信号の時間周波数特性を取得します。

ただし、ウィンドウフーリエ変換を使用して信号の時間周波数特性を取得する際の主な問題は、信号の時間パラメーターと周波数パラメーターに対して生じるいわゆるハイゼンベルグの不確定性原理です。

不確実性の原理は、特定の瞬間に信号に存在する周波数を正確に言うことは不可能であり(周波数範囲についてのみ話すことができます)、信号に周波数が存在する正確な瞬間に特定することはできないという事実に基づいています(期間についてのみ話すことができます) 。

これに関して、解像度の問題が発生します。 ウィンドウフーリエ変換の解像度は、ウィンドウの幅を使用して調整できます。

スケール(ウィンドウの幅の逆数)0.01のガウス型の狭いウィンドウを持つウィンドウフーリエ変換は、次の形式になります。

画像

ご覧のように、結果として得られるフーリエ変換は、時間に関する精度が高く、周波数に関する精度が低くなります(各最大値は特定の周波数範囲を占有します)。



スケールが0.00001のガウス型の幅の広いウィンドウを使用すると、ウィンドウ変換は次のようになります。

画像

この場合、周波数に関しては高い精度が得られますが、同時に時間に関しては非常に低い精度が得られることがわかります。



通常のフーリエ変換は、ウィンドウの幅が無限大のウィンドウフーリエ変換であると仮定できます。

したがって、ウィンドウの幅を広げる(解像度を下げる)と、周波数に関する精度が上がり、時間に関する精度が下がります。

最適な比率の精度を達成するために、ウィンドウの幅の値を選択するにはどうすればよいですか? ウェーブレット変換はこの質問に答えます。



ウェーブレット変換


ウェーブレット変換は、信号の時間周波数特性を構築するためのハイゼンベルグの不確実性問題を解決するツールとして作成されました。

ウェーブレット信号変換f(t)の形式は次のとおりです。

画像

ここで、Tauは時間シフト、Sはスケール、Psi *はマザーウェーブレットです。



ウェーブレットの概念とは、信号を通過する波を意味し、信号の(トートロジーについては申し訳ありませんが)統合中の特定の場所の特定の幅(スケール)のウィンドウです。

マザーウェーブレットは、ウェーブレット変換中に生成されるすべてのウィンドウのプロトタイプである関数です。

時間シフトは、信号の時間成分に沿って生成されたウィンドウの動きを制御します。

スケールの概念は、ウィンドウ幅の概念の反対です。 ウィンドウの幅が小さいほど、スケールは大きくなります。つまり、ウィンドウは信号の小さな部分をキャプチャし、信号はより詳細に統合されます。

ウィンドウの幅が大きいほど、スケールは小さくなります。つまり、ウィンドウはほとんどの信号をキャプチャするため、信号は「詳細」に統合されません。



正規化された振幅(0-1)で特定の期間(0-200ms)の間有効であった特定の連続信号のウェーブレット変換プロセス(ガウスがマザーウェーブレットとして使用されます)について説明しましょう。

1.積分は、初期条件Tau = 0およびS = 1で計算されます。

a)パラメータTau(i)= Tau(i-1)+ eが十分に小さい数eだけ増加し、積分が計算されます。 Tau(i)が200ms(信号の終わり)に等しくなるまで実行されます。

画像

2.パラメーターS = 5が変更され、Tauの値が再び信号の開始点に設定されます(Tau = 0)。

a)パラメータTau(i)= Tau(i-1)+ eが十分に小さい数eだけ増加し、積分が計算されます。 Tau(i)が200ms(信号の終わり)に等しくなるまで実行されます。

画像

積分は、パラメーターS = 20、S = 50などの値についても同様に計算されます。

説明されたプロセスの結果として、時間の各瞬間における各スケールの関数の積分の計算値を取得します。

したがって、スケール、時間、および振幅(計算された積分の値)の成分を含む信号の3次元表現を取得します。



次の非定常信号を考慮してください。

画像

そのような信号のウェーブレット変換は次のようになります。

画像

画像



したがって、すべての周波数で常に一定のスケールを持つウィンドウフーリエ変換とは対照的に、ウェーブレット変換は、低信号周波数でより良い時間表現とより悪い周波数表現を持ち、高信号周波数でより悪い時間表現を持つより良い周波数表現を持ちます。

図は、得られたウェーブレット変換が、高スケール値の領域(低周波数)で時間的に詳細になり、低スケール値の領域(高周波数)であまり詳細でないことを明確に示しています。



その結果、ウェーブレット変換により、得られた信号の時間周波数表現に対するハイゼンベルク不確定性原理の影響を減らすことができます。 これにより、低周波数は時間に関してより詳細に表示され、高周波数は周波数に関してより詳細に表示されます。



参照: ウェーブレットチュートリアル



All Articles