テクスチャ分類問題のローカルバイナリパターンステートメント

こんにちは、親愛なるhabralum!



この記事では、テクスチャ分類問題で使用される比較的新しい演算子についてお話したいと思います。 このタスクは、画像の検索、認識、分類のタスクに非常に近いものです。



LBP演算子を使用して、画像内のオブジェクト(たとえば、顔)を検索したり、特定のクラス(検証、感情の認識、顔による性別)に属するこのオブジェクトをチェックしたりできます。 慈悲に興味があり、猫をお願いします。



LBPオペレーターは、1996年にT. Ojalaによって最初に提案されました。 これは、画像内の隣接するピクセルの強度に応じて、画像内の各ピクセルを2進数で表す効率的な演算子です。



この演算子は整数演算でのみ動作するため(これにより一部のタスクでリアルタイムのパフォーマンスが可能になります)、計算効率が高くなります。また、さまざまな照明条件での撮影による画像の明るさの変化に不変です。



LBPとは何ですか? 画像ピクセルに適用される従来のLBPは、8つの近傍ピクセルを使用します。







中央のピクセルをしきい値として使用し、近傍の各ピクセルの輝度値を比較します。 この値がしきい値(または等しい値)より大きい場合、ピクセルは値1を取ります。0より小さい場合、結果の8ビット数はピクセルの近傍を特徴付けます。 そのような数のバリアントの総数は2 ^ 8 = 256です。 したがって、各画像ピクセルに、それを特徴付ける256個のラベルの1つを割り当てました。 さらに、これらのデータからヒストグラムを作成し、LBPヒストグラムを使用してテクスチャを比較することは難しくありません。



ただし、任意の数の重要なピクセルを持つ任意の半径の近傍を使用したいと思います。 2002年に、これらの条件を満たすeLBP(拡張LBP)メソッドが提案されました。 近所は次のとおりです。







バイリニア補間は、任意のピクセル近傍のポイントで輝度値を見つけるために使用されます。 つまり、ポイントには、隣接するピクセルの加重平均が割り当てられます。 それ以外の場合、メソッドは従来のLBPと同じように機能します。



ただし、近傍が増加すると、動作するために必要な数字の桁数が増加することがわかります。 つまり、半径が16ポイントのうち2の近傍の場合、16ビットで構成される数値をすでに処理する必要があります。 そして、ヒストグラムのビンの数は膨大になっています。 しばらくして、いわゆる均一なパターンがほとんどの情報を運ぶことがわかりました(残念ながら、耳を切らないようにこれをロシア語に翻訳することはできませんでした) 。 一番下の行は、これらのパターンには、レコード内の0から1への遷移とその逆の遷移が一定数しか含まれないということです。 つまり、指定されたトランジションの数が2(000トランジション11トランジション000-ユニフォーム(2トランジション)、00トランジション1トランジション00トランジション1トランジション00-なし(4トランジション)の場合、00011000または00000000はユニフォームパターンであり、00100100はそうではありません。



LBP演算子は、多くの分類子の一部として使用されます。 最も簡単なアプリケーションは、ヒストグラムを作成して比較することです(この方法について簡単に触れました)。 また、SVMやAdaBoostなどの機械学習アルゴリズムでも使用されます。 そして、一般の人々がこれらの方法に興味があるなら、これは新しい記事を書く良い動機になります。



ご清聴ありがとうございました。私のプレゼンテーションスタイルが理解できるほどシンプルであることを願っています。



-文学:

Zhiguang YangおよびHaizhou Ai-ローカルバイナリパターンによる人口統計学的分類



All Articles