可用性の問題へ

この記事では、コンピューターシステムの可用性の要件の実際的な実装に関連するいくつかのポイントについて説明します。



注:この記事は、一般的なITスペシャリストおよび正式な準備要件を満たす必要に直面しているIT部門のマネージャーを対象としており、信頼性スペシャリスト向けの新しい情報は含まれていません。



信頼性とフォールトトレランスの分野で必要なシステムを構築する場合、可用性係数Kgと運用可用性係数Koperの概念は、国内のエンジニアリング業務でよく使用されます。 GOST 27.002-89に従って、



Kg(t)= Tispr(t)/(Tispr(t)+ Trost(t))、



つまり、耐用年数tの労働時間とダウンタイムの合計に対する労働時間の比率



コペル(t、tau)= Kr(t)* P(tau)、



ここで、P(タウ)は、タウ区間での故障のない動作の確率、つまり、システムが特定の期間動作していた場合、次のタウ時間単位で故障しない確率です。



運用準備要因は、主に、運用中にリソースが集中的に消費される製品、つまり、技術システムの運用中に破壊される固体材料、火器、強力なレーザーなどを処理するあらゆる種類のツールにとって重要です。 コンピューター技術を含む十分に信頼性があり長寿命のデバイスの場合、典型的な作業セッションに特有の時間単位の間隔における確率P(タウ)は1に近いため、Koper係数は通常Kgとほとんど異なりません。



コンピューティングシステムの主な困難は、原則として、可用性係数Kgの目標値を確保することです。 Kgの計算には、正式にまたは思慮深くアプローチできます。



正式なアプローチでは、故障したユニットがスペアパーツで見つかった場合にのみ、スペアパーツ(スペアパーツストック)から取ったものと交換することで、常に製品を修理できることが理解されます。 与えられたブロックの信頼性指標に基づいたスペアパーツの計算には、希望する結果を比較的簡単に得ることができる特別な技術と既製のソフトウェアツールがあります。 ただし、確率論的な観点から、ここでの問題は、採用された信頼性モデルが異なる製品の障害を独立したイベントと見なすことです。これは、長い時間間隔のコンピューターでは現実に対応していません-多くの場合、デバイスは動作と動作の両方で同時に失敗しますおよび保管中。



思慮深いアプローチで、交換用のスペアパーツから取り出されたユニットが動作不能になった状況の可能性を考慮する必要があります(コンピューター技術の特性の劣化の性質を考えると、それは非常に可能性が高く、多くの場合、その動作の強度よりもデバイスの寿命に大きく依存します)。 この状況の変形は、信頼性の過度に楽観的な初期評価のために、必要なユニットの予備部品が最初に存在しないことです。 その後、ダウンタイムは、運用担当者が故障の修理責任者に通知し、修理組織またはユニットが故障したユニットを受け取り、新しいユニットを検索して購入した(または、成功率が低いシナリオでは製品設計を変更する問題を解決した)、それをチェックし、セットアップする時間で構成されます運営組織への送付と交換。 練習では、修理倉庫に複数の冗長性を持たない使い捨てユニットの場合、この場合のダウンタイムを2か月未満に短縮することはほとんど不可能です(一部のコンポーネントの取得時間が60日以上になる可能性がある場合)。



もちろん、重要な用途の機器を取得する場合は、製造元とサービス契約を締結して、故障したコンポーネントを短時間で交換することをお勧めします。 ただし、そのような契約が5年以上利用可能であることはまれであり、産業システムの計画された寿命には十分でないことがよくあります。



準備係数の式から生じる単純な比率を解きます。



Tispr1 /(Tispr1 + 2か月)= 0.95



そして



Tispr2 /(Tispr2 + 2か月)= 0.99



可用性係数0.95および0.99の一般的な値。



Tispr1 = 38か月(3年)およびTispr2 = 188か月(16年)を取得します。



したがって、可用性係数Kg = 0.95を確保するには、使用中の製品(およびそのスペアパーツ)で予想耐用年数3年のブロックを使用し、同時に2か月以内にスペアパーツを補充する必要があります。 このような状況は現実的であり、この場合、故障したブロックをスペアパーツから交換して製品を稼働容量に戻す戦略は非常に適切です。



Kr = 0.99の場合、別の図が現れます。 0.99の可用性係数を実現するには、すべてのユニットの予想耐用年数が16年を超えるか、施設にスペアパーツがない場合の修理が2か月よりも早く完了するか、16年以内にすべてのユニットの作動スペアパーツが常にあったことを確認する必要があります。 現在の状況で満たすための最初の2つの要件は非現実的です。 最後の要件は、スペアパーツのパッシブストレージでは満たすことができません。16年後、一部のユニットが故障すると、スペアパーツからの交換も故障する可能性が高いためです。 この要件を満たす唯一の方法は、障害が発生した場合の予備ユニットを含むすべてのユニットの操作性と交換の継続的な監視です。 このような制御を提供する方法は、ホットスタンバイ戦略です。



結論:



1.最新のコンピューターテクノロジーでは、通常の運用および保守条件下で、故障したブロックをスペアパーツから交換することにより製品のパフォーマンスを回復する戦略により、可用性係数0.95を達成できます。



2.単一の製品の一般的な運用および保守条件下では、最新のコンピューターテクノロジーでは、予備部品のみを使用して0.99の可用性係数を達成することは不可能であり、予備ユニットを含むすべてのユニットを常時監視するホットスタンバイまたは別の方法を使用する必要があります。



All Articles