ジッタ/パケット損失によるチャネル状態監視

こんにちは、同僚。

私の考えを集めて、私は自分に生まれた解決策を適切に作成することにしました。

だから、問題の声明：

ポイントAとBの間に2つのチャネルがあり、ほとんどの場合、異なるプロバイダーからのものです。つまり、これらのチャネルのサービス品質のアカウンティングを保証する必要があります。

1.チャネルの損失が0.5％を超える場合、チャネルを使用しないでください。

2.ジッタが10ミリ秒を超える場合、チャネルを使用しないでください。

この問題は私の仕事で発生しました。なぜなら、2つの都市は2つのチャネルで接続されており、このチャネルを介して多数の音声が流れるからです。誰も気にしない-あなたは猫の下で歓迎されています。

元の決定。

最初は、2つの不格好なオプションさえありました。最初は、tsiskaでpingovalkaを上げることで、チャンネルの存続可能性を確認し、その死を切り替えました。このソリューションは、損失がなくジッターに問題が生じるまで解決しました。

2番目の解決策は、G729コーデックを模倣するudpパケットに基づいてモニターを作成することでした。モニターは損失とジッターを示しました。通信の問題が発生した場合、管理者は猫に登り、ジッターと損失の現在の値を監視し、状況に応じてチャネルを無効にする決定を行いました。もちろんうまくいきました。しかし、これはある種の半自動システムでした。したがって、私は自分自身をまとめ、この状況を最終的な解決策にしました。

現在のソリューション。

したがって、2番目のケースのように、G729aコーデックを模倣するチャネル品質udpモニター（いわゆるSLAモニター）を作成します。

ip sla 33 
      

        
        
        
      

     udp-jitter 172.16.1.66 49333 source-ip 172.16.1.65 codec g729a codec-size 20 
      

        
        
        
      

     tos 70 
      

        
        
        
      

     threshold 10

このモニターは、宛先のポート49333に毎分間隔で1000パケットを送信し、tos = 70 = 0x46 = EFをマークします。宛先を有効にする必要があります

ip sla responder

次に、安定したトラックを作成します（アプレットを使用して制御し、SLAモニターにしっかりと結び付けないように特別に作成します）。

track 20 stub-object 
      

        
        
        
      

     default-state up

ここでのタスクは、SLAモニターから結果を削除し、その値に応じて、トラック20をUP状態のままにするか、それを配置することです。これは、たとえば、Cisco EEM（Embedded Event Manager）を使用して実行できます。これにより、ハードウェアの現在の状態を監視し、特定のアクションを実行できます。

これを行うには、2つのアプレットを作成します。少なくとも1つのパラメーター（ジッターまたは損失数）が私たちに合わない場合、トラックをDown状態にします。両方のパラメーターが正常な場合、2番目はそれを元に戻します。

構成

1.最初のアプレットを作成します。

event manager applet LB trap

RTTのSNMP OIDとSLAモニターからのジッターに基づいて2つのイベントを作成します。

event tag jitter snmp oid 1.3.6.1.4.1.9.9.42.1.5.2.1.46.33 get-type exact entry-op ge entry-val "10" entry-type value poll-interval 4 
      

        
        
        
      

     event tag loss snmp oid 1.3.6.1.4.1.9.9.42.1.5.2.1.1.33 get-type exact entry-op le entry-val "994" entry-type value poll-interval 4

ここで、SNMP OIDの最後の数字33はSLAインスタンス番号です。 10-ジッターのしきい値（ミリ秒単位）、994-送信された1000のうち返されるパケットの最小許容数（1000-packet_loss）。 poll-interval-猫が値の状態をポーリングする間隔。ここに4秒。

アプレットはどのイベントでも動作することを示しています。論理ORが使用されます。

trigger 
      

        
        
        
      

     correlate event loss or event jitter

さらなるアクション：

action 20 track set 20 state down

つまりトラックはDownに設定されています。

2番目のアプレットも同様です。

event manager applet LB2 trap 
      

        
        
        
      

     event tag jitter snmp oid 1.3.6.1.4.1.9.9.42.1.5.2.1.46.33 get-type exact entry-op lt entry-val "10" entry-type value poll-interval 4 
      

        
        
        
      

     event tag loss snmp oid 1.3.6.1.4.1.9.9.42.1.5.2.1.1.33 get-type exact entry-op gt entry-val "994" entry-type value poll-interval 4 
      

        
        
        
      

     trigger 
      

        
        
        
      

     correlate event loss and event jitter 
      

        
        
        
      

     action 20 track set 20 state up

アプレットのみがイベント間の論理ANDによってトリガーされます。そして、トラックが充電されます。

調査は4秒間隔で行われ、トラックの現在の状態は考慮されていないことがわかります。ギャングウェイは4秒ごとに絶えず発射されます。トラック自体の状態の監視を強化しようとしましたが、非常にバグが多く、常に機能するとは限りませんでした。それで私は数パーセントを寄付し、そのように残しました。

さらに、チャネルの問題とその消失について通知するアプレットがさらにあります。

event manager applet LB_info 
      

        
        
        
      

     event syslog pattern "20 stub Up->Down" 
      

        
        
        
      

     action 10 syslog msg "applet works!" 
      

        
        
        
      

     action 11 cli command "enable" 
      

        
        
        
      

     action 12 cli command "show ip sla stat 33" 
      

        
        
        
      

     action 13 mail server "192.168.6.20" to "ilya@tut_domen.ru" from "alert@tut_domen.ru" subject "Frame loss or high jitter on NiS channel" body "$_cli_result"

そして

変数$ _cli_resultには、最後のコマンドの出力結果、つまりこの例では、ip sla stat 33を表示します。

event manager applet LB2_info 
      

        
        
        
      

     event syslog pattern "20 stub Down->Up" 
      

        
        
        
      

     action 10 syslog msg "applet 2 works!" 
      

        
        
        
      

     action 11 cli command "enable" 
      

        
        
        
      

     action 12 cli command "show ip sla stat 33" 
      

        
        
        
      

     action 13 mail server "192.168.6.20" to "ilya@tut_domen.ru" from "alert@tut_domen.ru" subject "NiS channel is correct" body "$_cli_result"

言い換えると、私たちは自分自身に手紙を送っています。その本文は、実際にトラックの切り替えを引き起こしたSLAモニターの最後の起動の結果です。

それで、今実際にこれを考慮に入れる方法。次の2つの方法があります。

1.ルートマップの行（実際には機能しますが、トリッキーなスキームがあります）

set ip next-hop verify-availability 172.16.1.66 1 track 20

2.フォームのルートがある場合の統計の追跡

ip route 172.16.0.0 255.255.255.0 192.168.1.1 track 20

チャネルで損失またはジッターが発生した場合、このルートは単にルーティングテーブルから削除され、トラフィックは代替パスを通過します。

不器用かもしれませんが、何も起こらなかったよりも一週間苦しみました。彼らが言うように、豊かなもの。

PS私は読者がCiscoコンソールの基本に少し精通していることを意味します

PPS ip slaコマンドの構文は12.4Tと12.4によって異なりますが、意味は同じです。

PPS複数行の境界を超えない説明が必要な場合-書き込み、追加します。

よろしく

ポドクパエフイリヤ

_________

UPD ：CPUについて。一般に、アプレットのない負荷の下で、アプレットを使用すると、ルータの負荷（ISR 3845）が平均で約42％になります（43-44）。

All Articles

ジッタ/パケット損失によるチャネル状態監視

More articles: