間違った場所で問題を探している

これは、フォールトトレランスによってうまくカモフラージュされている小さな問題が頭痛になったときの実際の実践からの短編です。



小さな気質



小さなブランチであり、デスクトップアイロンに基づいた独自のPBX(アスタリスク+ FreePBX)と、1C、ファイルストレージ、仮想ROドメインコントローラーを備えた同じローカルターミナルサーボチャカを備えています。 インターネットはMikrotikを配布しています。 小さな枝で十分です。



すべては監視(すべてのモニターではなく、時間と怠everythingのため)から始まり、ブランチ内の1つのサーバー(PBXから)の過熱を報告しました。 地元の人々が問題を解決している間に、老人はthe落し、MySQLデータベースを少し壊しました。



多くのトラブルが前兆となったが、これは...



構いません、ベースが修理されました、すべてが機能するはずです。 しかし、地元の人々は文句を言い、呼び出しは壊れています。 さて、FreePBXに問題があります。バックアップを取って展開しますが、すべて問題ありません。



しかし、トラブルは発生しており、地元の人々はまだ不満を言っており、電話はうまくいきません。 それらの前に、呼び出しは正常に通過しますが、それら自体が呼び出し、または互いに呼び出した場合、数秒の遅延が取得されます。 私はアスタリスクとFreePBXの膨大で不明瞭なログを見始めましたが、彼らは問題を識別できません。 STUNとICEに問題があり、同様の遅延が発生したことを思い出します。 私は地獄にそれをオフにし、結果はゼロです。



落胆は悪い決断をする方法です



PBXを何時間も拾い上げても何も良い結果にならないのでがっかりします。すでに深夜ですが、問題は解決していません。



彼は朝まで問題を残し、新しい頭を望んでいた。 午前中、別の失敗した決定が行われました。システムが故障したため(依存関係はそれほど破壊的ではありませんでした)、すべてのパッケージを再インストールしてシステムを修正しようとしています。 結果はゼロよりわずかに大きく、遅延は減少しました(重要ではありませんが、すでに成功しています)。



OS(およびバックアップからのデータベース)の部分的な修復がほとんど成功せず、問題の根本がまだ明確ではなく、同時に多くの時間が原因の検索に費やされている場合、私は根本的に行動することを決定します:すべてをゼロからロールします(プロセスの自動化の利点は、許容できる時間内にこれを行います)。 コピーからFreePBX構成をロールします。 別の失敗。 結果はゼロです!



絶望-心が影になり、決定が悪化する



私は絶望に陥っています。 非常に悪い考えが始まります。おそらく、バックアップのconfは曲線であるかもしれません(多くの更新を行った後、動作しなかったので、理由を見つけることができませんでした)。何も残っていません。 なんて恥! 結果は厳密にゼロであり、多くの時間を費やしました!



受け入れは認識への道です



何が起こっているのかを理解しようと必死になって、私はログを注意深く調べ始めました。 パターンに気づきました。 内線は正確に5秒で呼び出し、15で3つの内線からの呼び出しのグループに対して! 私は通話の遅延についてグーグルを始めますが、特定の遅延をすでに示しています。 そして、私はすでに見つけた答えに出会います、人々は問題がDNSにあると言いますが、私は確かに問題がないことを知っています、すべてのアドレスが解決されました!



明らかなのは信じられない



何もする必要はありません。nslookupとbingoを受け取ります(すぐにできるといいのですが!) プライマリDNSは存在します(コントローラを使用した仮想ルーター)が、気が付きませんでした! DNSが1つあると、すぐにエラーが発生します;)



まとめ



監視で確認できる基本的な問題(すべてのノードに対して構成する必要があります)がDNSの復元力によって隠されていたため、愚かな状況を解決するためにほぼ2営業日が失われました。 すべてのスマットを怠zyにして、1分間の監視を設定します-存在しない問題を探します-2日間。



All Articles