ほとんどの場合、リソースは実際に豊富にあることがわかりますが、それらは穏やかに、無駄に使用するために使用されます。 問題は、継承された原則に従って、いわば平凡なガウジングまたは企業データセンターの拡張にあります。 行われた決定は、利用可能なリソースの効果的な使用についてはチェックされず、組織はそれらをチェックするための方法論を持たないため、結果を得ることができます。
そのように生きることができないことを自分で理解している場合は、Krok、Beeline、Data Lineなどの企業のブログを読むことから始めることをお勧めします。 エネルギー効率の分野での経験を共有する記事を見つけることができます。 それらの方法は機能します-商業サイトのPUEは1.3〜1.4の範囲(さらに小さい人向け)であり、TIER IIIでは優れた結果です。 しかし、ある時点で、メガワット、予備、経験豊富なスタッフがいる彼ら自身のパーティーがあることに気付くでしょう。 そして、あなたはそれに場所がありません。
データセンターが10ラック、200 kWの電力で、常に手と時間のない、単なる人間には何ができるでしょうか?
理想的には、簡単に理解できるチェックリストが必要で、それを拾い上げてメモを作成してサイトを散歩します。 この文書は、少なくともおおよそ、効率に対する提案された方法の影響を評価するのに役立つことをお勧めします(経験やベストプラクティスはありません)。 提案された方法がライフサイクルの段階ごとに分離されていると便利です。 たとえば、サーバーとストレージを購入するために集まって、トレーニングマニュアルの適切なセクションを調べ、購入したアイロンのパラメーターに関する推奨事項があります。
一般的に、私は苦しむことはありません、「データセンターに関するEU行動規範」と呼ばれるそのような文書があります。 私は彼らの仕事で彼らに導かれている人々に会ったことはほとんどないことをすぐに言わなければなりません。 パブリックドメインにあります 。
それで、このドキュメントとは何か、そしてなぜそれがあなたにとって役立つのか:
- これは、さまざまな分野の専門家が参加した執筆で、データセンターの有効性を向上させるためのベストプラクティスのコレクションです。
- データセンターのライフサイクルの段階で適切に構成されているため、たとえばIT機器の交換に簡単に対応できます。
- サブシステムによって適切に構成されています。 したがって、サーバーメンテナンスチームがいる場合、彼らはあなたの貢献度を簡単に評価できます。
- すべてのプラクティスで潜在的な影響の評価が行われます(1〜5、1-小さな影響、5-最大)。 これにより、実装コストと期待収益に基づいて、計画段階で評価を実施できます。
このドキュメントを読み、それをどのように扱うかを理解し、いくつかの例を検討することを提案します。
ただし、最初に小さな警告が表示されます。 信頼性とエネルギー効率は、データセンターをさまざまな方向に引っ張る2つのパラメーターです(常にではありませんが、頻繁に)。 例として、データセンターの温度上昇があります。 エアコンの消費を削減します。 しかし同時に、サーバー内の冷却ファンの回転数が増加しているため、サーバーの消費量が増加しています(おっと...)。 また、ファン自体のリソースが削減され、終了するとファンが立ち上がり、サーバーも温度に追随します。 したがって、変更は慎重に行い、隣接システムへの影響を監視し、常に元の位置にロールバックする計画を立てる必要があります。
それで、辞書を取り、読み始めます。 すぐに3ページの2.2項に進んでください。ここでは、プラクティスの色分けがデコードされます。
グリーン-アプローチ、監査、監視など 材料投資の面で最も効果的なアイテム。 ほとんどの場合、最小限の投資(5.1.4キャビネットへのダミーパネルの設置)または運用アプローチの変更による投資ゼロ(4.3.1。未使用機器の監査)が含まれます。
赤-新しいソフトウェアの導入。 「バックグラウンドのプロセスがハングせず、CPUをロードしないことを確認する」などの完全なナンセンス。 安全にスキップできます。 ただし、何百ものアプリケーションがある場合は...
黄色-新しいIT機器を購入するときに探すべきもの。
青-次の再構築またはメンテナンスで行う必要があること。 いわゆる「レトロフィット」の例があります。 既存のデバイスの機能強化。 たとえば、UPSバッテリーを交換するときは、鉛バッテリーをLi-Ionに交換します。これにより、空調システムを放棄し、エリアの一部を空けることができます。 または、エアコンを修理するときは、速度制御装置を取り付けます。
白-候補者には必須ではないコンプライアンスのオプション。
ここでは小さな余談が必要です。 このトレーニングマニュアルは、自主プログラム「データセンターの欧州行動規範」に参加したい事業者向けに作成されました。 したがって、ドキュメント全体で「候補者」という用語を使用していますが、これは煩わしいものではありません。 「ホワイト」プラクティスには、データセンターの運用と構築へのアプローチに関する適切な推奨事項が含まれています。
次に、9ページの章番号3にすぐにジャンプします。 文書のさらなる移動は、順次実行する必要があります。 サブシステムは、データセンターの消費電力(IT機器、冷気、電気など)への影響の順に説明されています。
さまざまなサブシステムのさまざまな色の実践を適用し、精神的にテストしてみましょう。
「グリーン」、4.3.1項。 影響-5.使用する機器、設置場所、および提供するサービスを監査することをお勧めします。 どんなに馬鹿げているように聞こえるかもしれませんが、多くの組織では、「これはどのようなサーバーですか?」という質問に直面しました。すべてのエンジニアは肩をすくめました。 そして、これは最大30台のサーバーがあるサーバールームにあります。 また、組織内の3人が使用するサービスを実行するサーバーは言うまでもありません。 真剣に、特に最近入社した場合は、この観点からサーバーパークを見てください。
4.3.2項は自然に見えます。 影響-5.「使用されていない機器を運用から外し、アンロードされたデバイスの定期監査を実施します。」
素晴らしいパラグラフ4.3.8。 影響-4.「機器の環境要件の監査を実施します。 交換または移転のために、このような機器にラベルを付けます。 たとえば、ERPの下にいくつかの新しいサーバーがあるとします。 そして、温度要件が厳しい、少し古い-25度以下。 彼らは立って動作しますが、ホールの温度を上げることはできません。 そして、新しいサーバーで回転しているERPが成長すると、より強力なハードウェアが必要になります。 新しいサーバーが購入され、以前のいくつかのサーバーが置き換えられます。 この場合、トレーニングマニュアルでは、交換したサーバーをe-bayに配置せず、温度制限のある古いマシンの交換を行うことを推奨しています。 つまり 実際、1つのサービスだけでなく、最も古いハードウェアの廃止に伴い、いくつかの新しいハードウェアに移行しています。 アップグレードはERPのために行いましたが。 一般的に、より深く、さらに見てください。
グリーンアイテム5.1.4キャビネットへのダミーパネルの取り付け。 そしてそれで5.1.7と5.1.8。 最小限のコストで、熱気と冷気の混合を大幅に減らし、冷却効率を高めることができます。
それでは、機械システム(コールドサプライ)のセクションに進みましょう。 条項5.1.2。 影響-5.この段落では、冷気と温風のコンテナ化を適用することにより、温風と冷気の流れを分離することを提案しています。 練習は「青」、つまり 後付け。 トレーニングマニュアルでは計画的なダウンタイム中にアップグレードすることを推奨していますが、キャビネットの設計にしか影響しないため、実際に稼働しているデータセンターで実行できるのはこれらの作業です。 現在、実質的に工具や穴あけのない断熱回廊の建設のためのソリューションがあります。 そして再び、私はあなたに関係を思い出させます。 彼らはコンテナ化を行いました-少なくとも供給空気の温度設定を上げることが可能であるために、エアコンの設定を再検討してください。 そしてすぐに、5.4.2.4項(効果-2)および5.5.1(効果-4)にメモを作成できます。室内ユニットにファンとコンプレッサーの無段階速度制御を装備します。
黄色のプラクティスは、サブセクション4.1および4.2にほぼ完全に集中しています。 主にIT機器の調達に関連しています。 エンジニアリングシステムの寿命は少なくとも10年です。 そして、あなたが今持っているものは、アップグレードすることしかできません(つまり、「青い」プラクティス)。 IT機器は頻繁に変更されており、次の四半期に「黄色」のプラクティスを適用することが可能です。 例として以下の推奨事項を示します。 「新しい鉄を購入するための技術仕様を作成するときは、動作温度範囲に注意してください。」 したがって、サーバー、ストレージなどを作成する制限なしにエネルギー管理方法を実装するための基礎を作成できます。 「サーバーの吸気口での電力消費と温度のための組み込みの監視ツールが必要です。」 これにより、パスポートデータに基づくリソースの評価から、リアルタイムデータに基づく評価に徐々に移行できます。 当然、これにはすべて、第9章で概説されている監視およびレポートのアプローチの変更が必要になります。
私はそれらを無視するという観点から「赤」の慣行を考慮しません。 誰かがコメントで彼らの有効性を実証できたら嬉しいです。
ホワイトプラクティスは、企業のデータセンターにとって絶対的なハードコアです。 「A4 ASHRAEクラスを与えてください!」、「通りからすぐに空気を吹き飛ばしてください!」、「UPSを使用してください-男ではありません!」というスローガンはどこにでもあります。 これはまさに、エネルギー効率の高いゲームが信頼性を低下させる場合です。
要約:
- 推奨されるプラクティスは、ロケット科学ではなく、理解および実装するのに十分なほど単純です。 今すぐ開始できます。
- 最初は、「グリーン」な方法に注意してください。 それらは大きな影響力を持ち、シンプルで安価であり、計画と運用のアプローチを変えることができます。 これは、ほとんどの高度なケースで、すぐに目に見える効果をもたらします。
- 当然、動きは最も影響力のある(5)から最も影響の少ない(1)に移動する必要があります。
- 計画を立てます。 「グリーン」な方法を導入した結果、現在あるものの全体像が得られます。 使用する技術の理解を含む。 使用するすべてのサブシステムの最新化計画を作成し、トレーニングマニュアルのポイントを示します。 変更の予算評価を実施し、メソッドの影響に基づいて修正係数を適用すると、優先アクションのプランが表示されます。
- システムの接続を忘れずに、相互の影響を追跡してください。 そして、このために、あなたの手が届くすべてのものを監視し始めてください。
そして、私はほとんどヘッダーからケースを忘れていました。
X社は、企業のデータセンターを追加のスペースに拡張するための予算を計算するよう求めました。 高度に負荷のかかったラックを2つ配置する必要がありました。 彼らによると、手術室にラックを配置する物理的な場所はなく、コールドリザーブはなく、UPSはピーク容量の85%で動作しており、十分ではありませんでした。 予算を考えたところ、非常に多くのお金がありました。 サイトを見に行きましょう。 検査中に、次のことが明らかになりました。
- 1. 40ラックのホールでは、上げ床からの空気分配が使用されました。 同時に、断熱システムはありませんでした;キャビネットには、キャップで覆われていない多くの空のユニットがありました。 既存のシステムの冷却能力により、多かれ少なかれ明確になりました。 同時に、物理的な配置の問題の解決策が登場しました。
- 2. UPSログを調べて、UPSの負荷が夜間に増大していることを確認しました。 論理的には、減少するか、同じプラスまたはマイナスのままである必要があります。 バックアップの作成、一部のデータベースまたはアプリケーションの更新に非常に似ています。 ただし、アプリケーションは週末にのみ更新され、データベースはそれ自体で存続し、バックアップは現在2年間、別のサイトにリアルタイムで実行されています。 理論的には。 実際には、一部の悪い人々は予約の原因となったインフラストラクチャの一部を廃止しなかったことが判明しました。 同じ場所で、不要な鉄を消すと必要なキロワットが得られると考えられていました。
- 3.彼らは質問をしました:「あなたは監査を命じますか、あなたはすべてを自分で理解しましたか?」。 「理解し、理解した」と彼らは答え、長い間姿を消した。
会話の後、2人のエンジニアの助けを借りて、顧客は2週間にわたって2年間蓄積していた混乱を引き起こしました。 冷廊の断熱構造、キャビネットのキャップが注文され、製造されました。 冗長ハードウェアは物理的に廃止され、その過程でさらにいくつかの未使用のサーバーが見つかりました。 上げ床の下の整頓されたワイヤー。 その結果、余裕があっても必要なキロワットとユニットを受け取りました。 私たちの費用は3 131ルーブルになりました。 ガソリンおよび労働時間用。 しかし、私たちはそれらを顧客に提供しませんでした。
そして、彼らは高負荷ラックを設置しませんでした。