連続操作中にコンピューター技術の信頼性を確保した経験

私のリーダーシップの下で設計された小さな一連のコンピューター化されたシステムの運用の10周年は終わりです。結論の普遍性を装うことなく、それにもかかわらず、ジュビリーの機会に、長い時間間隔にわたるコンピューター技術の信頼性に関するいくつかの結論を引き出すことができます。



私たちが検討している操作経験を持つ製品は、リアルタイム測定用に設計されており、独自設計の多数の電子モジュールと、階層的に編成されたコンピューターのグループで構成されています:WindowsのICP PPC-5150タイプの産業トップレベルワークステーション、ICP WSタイプの産業制御コンピューター-855 DOS制御下の1つのRocky-C800プロセッサボード、およびDOS制御下のFastwel CPU-188組み込みコンピュータ。 施設の運用単位は、互いに予約する2つの製品のグループと、スペアパーツ(スペアパーツとアクセサリー)のグループセットです。 合計で、ロシアのさまざまな集落には約10の操作対象があります(それぞれ、20の製品、またはスペアの部品と付属品を考慮に入れた80のコンピューター)。 製品の動作の保証期間は10年、指定された耐用年数は20年です。



一般に、10年以上にわたる製品の運用は成功しました。 適切に選択された予約ポリシー(フルホットスタンバイに加えて、予備部品の信頼性が最も低いブロックとモジュール)のおかげで、意図した目的で製品を使用できないという単一のケースはありませんでした。



前述のシリーズおよび一部の製品の動作の結果から得られた、コンピューターシステムの開発者にとっての信頼性の分野における主な結論を引用することができます。 収集された統計のいくつかの有用な詳細は、それを修理センターの幅広いデータと区別し、ハードウェア構成、ソフトウェア、およびさまざまな施設にインストールされた製品を操作する対象タスクの類似性によって与えられます。 したがって、結論:



1.かなりの数の製品障害(この場合、約50%)は、市販のコンピューターコンポーネントの障害に関連しています。 コンポーネントを節約しなかったので、この結果は私たちにとってまったく予想外でした。また、開発が少ないため、先験的に私たちの電子機器の信頼性が低下すると予想していました。 上記の一連の製品では、コンピューターコンポーネントについて1年に平均1件の苦情が寄せられました。



2.動作の初期期間(数ヶ月)があり、その間、製造元とのテスト中に顕在化する時間がなかったコンポーネント固有の欠陥が顕在化します。 初期期間の誤動作の統計は、明らかに認識されていない工場の欠陥に関連しており、動作中の特性の劣化に関連するその後の期間(1年以降)の統計とは大きく異なります。 初期の期間に検出された誤動作のほとんどは、今後繰り返されません。



3. 2年目または3年目にコンピューターのコンポーネントが故障した場合、同じコンポーネントが将来故障する可能性が高くなります。 このことから、2〜3年の運用結果に基づいて追加の修理在庫を作成することをお勧めしますが、このタイプのコンポーネントはまだ製造中止ではありません。



4. PPC-5150タイプのコンピューターとそのコンポーネント部品は数回故障しましたが、WS-855とCPU-188およびそのコンポーネント部品は初期期間後に一度も故障しませんでした。 おそらく、これは、PPC-5150の高度な統合、高周波数、および高温度によるものです。



5.電子モジュールの故障の可能性は、その動作の対象物に非常に大きく依存しています。 サンプルの作成中に施設の運用担当者が変更されたが、統計の性質は変わらなかったため、この依存性は人的要因に還元されません。 おそらく、その理由は、電源または気候機能の品質に限定されます。



6.コンパクトなシステムユニットでは、メーカーは非標準の設計ソリューションを選択し、必要に応じて変更する傾向があります。 これは、たとえば、名目上一般的なICP PPC-5150シリーズが、構造的に互換性のない一連のモデルに分割されるという事実につながります。 たとえば、古いPPC-5150のマザーボードに障害が発生した場合、新しいPPC-5150からマザーボードをその場所に(少なくともジグソーとエポキシなしで)取り付けることは不可能であり、システムユニット全体を交換する必要があります。 [ここにAppleの言及があるかもしれない]。



7.耐用年数の長い製品を設計する場合、耐用年数が制限されている内蔵電源(バッテリー)に注意を払う必要があります。 マザーボード上のCR2032などの標準的なバッテリーを数年後に簡単に交換できる場合、分離できない構成にバッテリーを含む統合モジュールとマイクロアセンブリを使用すると、製造中止時に重大な問題が発生する可能性があります。



8.コンピューターのシステムユニットを予備部品に完全に入れておくと、非常に便利です。 運用担当者がシステムユニット全体を交換し、製造元と協力して、故障している部品を見つけようとするよりも、故障のローカライズに対処する方がはるかに簡単です。 一般に、実践では、特別な資格を持たない作業員に委託することが望ましい唯一のタイプの修理作業は、欠陥ブロックまたはモジュール全体の交換であることが示されています。



9. DVD-R / RWに記録された情報は、幸運だけで数年より長く生きます。 ただし、情報の長期保存については別の記事を書くことをお勧めします。



All Articles