Big Threeサーバーのエラーと問題:パート1。 デル

改装されたサーバーに従事しているため、さまざまなブランドの問題に対処する上でかなりの経験を積んでいます。ビッグスリーマシンの例(Dell、HP、IBM)で共有したいと思います。 だれも気分を害したことがないように、アルファベット順にします。







この投稿では、サーバーの診断、復元、および保守の豊富な経験を持つエンジニアからフィードバックを収集しました。記載されている各エラーは、汗と血によって解決されました。 保証期間内にサービスを受けた場合、この情報は役に立ちませんが、それでも役に立つ場合があります。



ソフトウェア更新



ソフトウェアの更新の問題は、3〜5年以上前のDELL機器に関連しています。 Dellサーバーでのすべての操作は、サーバーソフトウェアに組み込まれているLifecycleとiDRACを使用して行われることを思い出してください。



Dell 7 Integrated Remote Access Controller(iDRAC7)-サーバーに電力が供給されていないが、インターネットと電源が接続されている場合でも、サーバーにリモート接続するDellサーバーソフトウェア。 サーバーに接続すると、ソフトウェアはシステムのステータスに関するデータを表示し、BIOSからマザーボード上のドライバー、電源など、およびファームウェアまでのすべてのコンポーネントをテストおよび更新することもできます。



ここで、標準シナリオには、2つのオプションがあります。 まず、フラッシュカードから手動モードで更新します-サーバーにインターネットが接続されていない場合。 次に、ライフサイクルに入り、フラッシュドライブから更新します。 問題が発生した場合は、サーバーをインターネットに接続してアップデートするか、iDRACを介して初期設定を復元し、必要なアップデートをインストールします。



ただし、サーバーが十分に古い場合、ライフサイクル更新および診断システムからインターネット経由でソフトウェアをインストールしようとすると、ほとんどすぐに問題が予想されます。 この問題の理由は、製造業者が最初にこのシステムの夜明けにFTPサーバーの保護プロトコルを使用してサーバーコンポーネントのファームウェアを更新しなかったためです。 このような保護証明書が導入された今、3〜5年前の古い機器をインターネット経由でアップグレードするのが難しい場合があります。



問題は非常に簡単に解決され、多くの人はおそらくこれを行う方法を推測しているでしょう。ソフトウェア、つまりライフサイクルを更新しますが、最初にIDRACシステムを更新します。 アップデートは、デルの公式テクニカルサポートサイトから無料で入手できます。 ( 保証を確認し、アップデートをDellサーバーにダウンロードします )。



この操作の後、サーバーのリリースの年に関係なく、インターネット経由ですべてのドライバーとその他の更新プログラムを便利にダウンロードできます-もちろん、製造元のWebサイトに更新プログラムのセットがない限り。



IDRACアップデートエラー



iDRACは、オプション「標準」、「エクスプレス」、「エンタープライズ」に表示されることを思い出してください。 この標準は、サーバーを購入するときに含まれます。 「エクスプレス」の完全なセットを注文する場合、サーバーのマザーボードに適切なライセンス済みチップを配置します。 したがって、新しいポートを取得します。これにより、Webを介してより有益なデータを受信できるようになります。



標準ライセンスを使用すると、稼働中のコンピューターのブラウザーを介してiDRACシステムに接続すると、標準タブ、サーバーサービスタグ、モデルなどのシステム情報の概要が表示されます。







エクスプレス経由、つまりiDRACのバージョン7がある場合は、BIOS、ライフサイクルなどを既に更新できます。 iDRACリモートアクセスシステムから直接。 システムの初期バージョンでは、残念ながらこの機能は提供されていません。フラッシュドライブを介してのみ更新できます。



エンタープライズは、iDRACポートを介した利用可能なサーバー管理機能の最も完全なセットです。これにより、アップデート、コンポーネントの完全なリスト、サーバーの現在のステータスの両方を完全に監視できます。 これは便利で機能的なキットですが、なんとか小さいながらも重大な欠点を見つけることができました。



iDRAC Enterpriseバージョン1.30.30または1.45.45のアップデート後、システムは初期化を停止し、設定が正しくないため起動しません。 その結果、BIOSを介して設定にiDRACを入力した場合、それを無効にしたり、復元または再起動するために何も取ったりすることはできません。



ほとんどのユーザーにとって、この状況で唯一の解決策はテクニカルサポートに連絡することです。 サーバーの保証期間内であれば、専門家がマザーボードを交換します。 次に、この問題に直面しましたが、奇妙なことに、公式のDellフォーラムで説明されている完全に標準的なソリューションが役立ちました。サーバーを5分間切断し、電源を抜き、すべてのワイヤを切断する必要がありました。 確かに、これで解決しない場合は、マザーボードを交換する必要があります。



エラーE1410



アップグレード後にエラーE1410が発行されます。別のプロセッサを追加しましたが、何らかの理由でサーバーが起動しません。 むしろ、点灯し、インジケータが交互に点灯し、大きな音を立てますが、画面には何も表示されず、診断パネルのディスプレイにエラーを書き込みます。







この場合の問題は、CPU 1ソケットで、ソケットの脚が曲がっており、プロセッサに隣接していることです(1つまたは複数)。 画像では、ソケットの作業脚(左)と曲がっている場所(右)を確認できます。 脚は手動で真っ直ぐにすることができ、これにより問題が解決します。



ご想像のとおり、このエラーでは、最初のプロセッサの機能の一部がオフになっているため、2番目のプロセッサは起動しません。 どっち? 多くのオプションがありますが、そのうちの1つは、これらが2番目のプロセッサの起動を担当するレッグであるか、RAMユニットが2番目のプロセッサから起動しません。 どちらの脚が曲がっているかによって異なります。



RAMの不適切なインストール



多くの場合、アップグレード時に問題が発生します。 この場合、私たちは完全に人的要因について話しています。 ただし、このエラーは、各モデルにインストール用の独自の仕様があるため、非常に広まっています。 まず、モデルに応じて、ほとんどすべてのサーバーに異なる数のポートがあります。 したがって、一定量のRAMをポートに追加する必要があります。 タスクが何度も複雑になる場合があります。たとえば、モデルDELL R610には3チャンネルのRAMがあるため、チャンネルごとに3つのスロットを追加する必要があります。 12個のスロットと4個のチャンネルから選択することで、間違いを簡単に犯すことができます。



メモリタイプDDR3インターフェイスは、チャネルあたり最大2つのRdimmまたはUDIMMモジュールの3つのチャネルで構成されます

シングルまたはダブルランク、およびクアッドランクのチャネルごとに最大2つのRdimmモジュールの場合。 インターフェイスは、2 GB、4 GB、8 GB、または16 GBのRdimmモジュールを使用します。 また、1 GBまたは2 GBのUDIMMをサポートしています。



したがって、メモリ計算が正しくない場合、スラットの1つまたはいくつかが間違ったスロットに取り付けられている場合、または最適な構成には不十分な場合によく発生します。



2番目のポイントは、多くの場合RAMの不一致につながりますが、サーバーのメモリは電源に応じて1.35 Vと1.5 Vに分割されます。1.35ボルトのRAMは、プロセッサの56番目のバージョンからのみ起動します。 サーバーの以前のバージョンでは、定格が1.5ボルトのトリムしか使用できません。 サーバーのレベルが異なる場合、サーバーは起動せず、適切なエラーが発生します。



ソケットが曲がっていて、2番目のプロセッサを起動するエラーの場合と同じように見えます。 ディスプレイ画面にエラーがない場合、サーバーは「サーバーが起動しています...」と表示し、画面に何も表示されない場合は、メモリ構成を確認してください。 仕様に従ってメモリを交換し、正しいスロットに取り付けて、最適な構成を取得してください。



デルサーバーの利点



公平を期して、Dellサーバーの利点について説明することにより、この記事を締めくくりたいと思います。 そして、私たちの意見では、彼らは上記の問題を完全に平準化します。 結局のところ、まずこれらの問題はサーバーの再構成中に発生します。





この記事が、使用済みサーバーのアップグレード、診断、購入に役立つことを願っています。 まだ質問がありますか? コメントを書いてください。






All Articles