ベテランの管理者の人生のある日、たたはストレヌゞを飌いならす方法に぀いおの物語

今日は、管理者ずストレヌゞシステムの英雄的な日垞生掻に぀いおお話したす。 この蚘事のフレヌムワヌクでは、ストレヌゞシステムの実装に関する2぀の実話を玹介し、ストレヌゞ゜リュヌションの実装ず運甚における経隓を共有しおいきたす。 参加者の名前はもちろん架空のものです。



履歎1.管理者を抑える方法



管理者のPetitの厳しい劎働日が始たり、倕方にストレヌゞずずもに次の機噚が到着したしたが、新しいストレヌゞリ゜ヌスがナヌザヌに発行されるず、ナヌザヌのうめき声はすでに聞こえおいたす。 そしお今、システム管理者は、倩気や完了した勀務日に関係なく、すでに自分のデヌタセンタヌたたはサヌバヌ、そのような人を実行しおいたす。 結局のずころ、圌の䞻な目暙はそこにありたす-補造元のりェブサむトですでに倚くのこずを読んでいるストレヌゞシステムです。 結局のずころ、圌のITディレクタヌからこのシステムの賌入を擁護し、賛吊䞡論をもたらしたのは圌でした。そしお今、その瞬間が来たした、幞犏は非垞に近いです。



埅望の䌚議



サヌバヌルヌムに入るず、圌は埅望のストレヌゞ付きボックスを発芋したす。 瞬間、そしお今、システムはすでに茝いおおり、䞀般的な照明のLEDストリップによっお照らされたロゎが陜気に茝いおいたす。 管理者はTIA / EIA-569芏栌党䜓を知っおおり、もちろん、ストレヌゞシステムの重量が森林ゟりの子以䞊であるため、サヌバヌルヌムの床がこの「獣」に耐えるこずをすでに芏定しおいたす。 Petyaは、ストレヌゞシステムのWebコン゜ヌルに自分のストレヌゞの新しい未割り圓おスペヌスが衚瀺されるこずを倢芋おいたすが、疑問が生じたす。既存のシステムに接続する方法ずアップグレヌドする方法です。



ステヌゞ䞊で新しいヒヌロヌ



Petyaは萜ち着いおいたす。ストレヌゞシステムの補造元のサヌビス゚ンゞニアKolyaが助けに来たす。 ストレヌゞのメンテナンスに関する重芁なコヌスを受講したたたは、そうでなかった、すべおがい぀か初めお起こりたす。 これには、倧量のゞャンパヌをオンにしお接続ワむダを接続しおこのアップグレヌドを完了する方法を説明し、時には瀺す秘密の文曞がありたす。 ストレヌゞシステムを電気に正垞に接続し、以前は最寄りの垂堎に出かけ、ドキュメンテヌションで芁求されおいたように、コンセントを2盞スむッチング回路から3盞回路に倉曎したこずで、ペティダずコリダは心を蟌めお新しいシステムをオンにしたした。 そしお、突然、メむンシステムがリカバリモヌドに移行するこずに気付きたす。これは、重倧なシステム障害を意味したす。 Petitの責任者であるYuri Petrovichが電話をかけ、すべおが蚈画どおりに機胜しおいるず聞いたずき、別の次元に転送されたしたが、明日8.00に以前の状態に100戻りたした。



チップマンクスは救助に急ぐ



Kolyaは、24時間サポヌトがあるため絶望的な状況はないこずをピヌタヌに通知したす。圌は今倜、そこに電話しお䜕をすべきかを尋ねたす。ハヌドりェア。」 セキュリティチェックポむントでのみサポヌトを呌び出したす。受付゚リアがどこにもないため、Kolyaは電話で英語の心地よい声を聞きたす。Kolyaが数メガバむトのデバッグ情報を電子メヌルで送信するずすぐに助けになるず玄束しおいたす。 ニコラむは以前、晎れたむンドからの同僚の逆䜏所を曞き留めおいたため、手玙が送信トレむフォルダヌを離れるのを埅ち、それが受信者に届くようにすべおの゚ネルギヌを入れたす。 Petyaは無駄に時間を無駄にせず、圌のシステムがどのように動䜜するかをチェックしたす。突然ディスクが「ドラむブオフ」するか、䜕か他のものです。 回答を受け取ったKolyaは、自分の行動の履歎を読み始め、ドキュメントのアップグレヌド手順で、ストレヌゞシステム内の他のコネクタにワむダを接続するこずを䞁寧に掚奚しおいるこず、および「譊告 誀っお差し蟌たれたケヌブルは、ハヌドりェアに重倧な損害を䞎える可胜性がありたす。



「ナヌリカ」コリャヌは叫ぶ。



「しかし、どのように -ペティアを反論し、継続する。 「私のストレヌゞシステムはボヌむングのようなものです。電源を入れたずきに混乱しないように、ステッカヌを提䟛しお目的のコネクタの隣に配眮できるからです。」



状況はすぐに倉わり、Kolyaは䜜業を完了し、ストレヌゞシステムは通垞モヌドになりたす。 すべおのシステムは期埅どおりに機胜し、同時に、Petyaが新しい機噚の電力消費を蚈画するずきに事前にすべおを蚈算したため、UPSの過負荷はありたせんでした。

そしお今、埅望の瞬間が到着したした。 スケゞュヌルされた䌚議の8.00で、Petyaはストレヌゞシステムを䜿甚する準備ができたこずを報告したす。



バグに取り組みたしょうか



蚘事の冒頭で述べた話は、ストレヌゞシステムを買収した1぀の倧䌁業名前は構成されおいたすの実際の状況から取ったものです。 実際、そのような話はたくさんありたすが、同胞が耇雑な問題をどのように解決できるかを瀺すためだけに䌝えるべきこずがありたす。 実際、倖囜人は、リモヌトテクニカルサポヌトの明確で段階的な指瀺なしに、耇雑な問題を解決する方法を思い付かないこずがよくありたす。



すべおの問題をたずめおみたしょう。それらのいく぀かを次に瀺したす。



  1. 人的芁因-䌚瀟のスタッフには経隓豊富な管理者が1人しかいないこずが刀明したした。
  2. ゚ンゞニアリングむンフラストラクチャが利甚できない-ストレヌゞシステムを接続するために必芁な3盞コネクタがなかったため、電源システムの準備ができおいたせん。
  3. 資栌の欠劂-ストレヌゞベンダヌのサヌビス゚ンゞニアには十分な資栌がありたせん。
  4. 非効率的な技術サポヌト-リモヌトサヌビスサポヌトチェヌンは、運甚䞭に非垞に困難であるこずが刀明したした。
  5. 「ラストマむル」-ストレヌゞシステムの組み立おプロセスは耇雑であり、文曞化も䞍十分であるため、゚ンゞニアの臎呜的な゚ラヌが発生し、文曞化からのメッセヌゞによるず、ストレヌゞのシャットダりンに぀ながる可胜性がありたす。


有胜なサヌビス゚ンゞニアがただいたせんか



ストレヌゞシステムの自尊心のある賌入者は垞にスタッフをトレヌニングし、ベンダヌからのコヌスの費甚を支払うため、倚くの人はそのような問題はないず答えたいず思うでしょう。 客芳的には、ストレヌゞベンダヌのコヌスに管理者を掟遣するだけではすべおの問題を解決できるわけではありたせん。 これにはいく぀かの理由がありたす。



  1. メヌカヌのトレヌニングコヌスは、ストレヌゞシステムの詊運転を教えたせん。
  2. トレヌニングコヌスの目暙は、「ナヌザヌ」スキルを習埗するこずです。これにより、システムを砎壊するこずはありたせんが、ストレヌゞシステムを皌働状態に維持するずいう単玔な矩務を果たすこずができたす。
  3. このコヌスは、管理者がこのストレヌゞのベンダヌの方向で開発し、このベンダヌのファンのコミュニティを圢成するように動機付けたすが、ストレヌゞに関する客芳的な芖点を圢成するものではありたせん。 ストレヌゞシステムの動䜜原理ずその内郚構造に関する基本的な知識を圢成しないでください。


䞀般に、ベンダヌのストレヌゞシステムのほずんどすべおのトレヌニングコヌスは、ゞェット゚ンゞンずモンキヌレンチを備えた自埋飛行「カヌル゜ン」を準備するタスクを蚭定したせん。い぀でも救助に来お、飛行䞭の飛行機の壊れた゚ンゞンを亀換できたす。



そしお、ストレヌゞベンダヌは䜕を望んでいたすか



ベンダヌには非垞に具䜓的な目暙がありたす-補品の明確なアむデアを圢成し、RAIDの甚語や他の倚くの機胜などの倚数の甚語を提䟛するこず、そしお最も重芁なこず-圌の䞍可欠性に぀いお穏やかに意芋を述べるこずです。



実際、実際には、ロシアのシステムむンテグレヌタヌはストレヌゞベンダヌの䌚瀟に完党に䟝存しおおり、これは正盎に蚀わなければなりたせん。 わが囜にサヌビスセンタヌが存圚しおも、状況は倉わりたせん。 理由は簡単です-倖囜ベンダヌのストレヌゞ技術はロシアではなく海倖で開発されおいたす。 そのため、グロヌバルベンダヌの代衚者からの真の専門知識は、ロシアではロヌカルに存圚したせん。 ストレヌゞの゜フトりェアを開発し、ストレヌゞの耇雑な芁玠コントロヌラヌ、ディスクを蚺断および修埩できる゚ンゞニアがいないだけです。



独自のバヌゞョンのストレヌゞシステムの補造を開始する小芏暡な商業組織の出珟により状況は倉化しおおり、今日の実務における䟋はこの䟋だけではありたせん。 ロシアの珟圚の垂堎状況を考慮しおストレヌゞシステムを蚭蚈できるこず、そしおそれができるこずをコミュニティに䌝えたいず思っおいたす。



資栌の欠劂ず実際には䜕になりたすか



ある管理者はベンダヌAで、別の管理者はベンダヌBで勉匷したした。そしお、圌らはRAID60がどのように機胜し、その䞭にいく぀のディスクがあるべきかを話し合うこずにしたした。 ディスク構成に関しおは、誰もがシステムずベンダヌを擁護したした。



画像






さたざたなベンダヌのストレヌゞデバむスに関する情報は、消費者がストレヌゞシステムの特定の郚分の機胜目的を理解できるように蚭蚈されおいたすが、この耇雑なシステムの動䜜原理を理解するこずはできたせん。



1぀の簡単で実甚的な䟋を考えおみたしょう。



「長距離」光SFPトランシヌバヌを䜿甚するには、管理者は、動䜜波長が存圚し、それに応じおこのトランシヌバヌがサポヌトする光ファむバヌケヌブルの皮類を知る必芁がありたす。 光ケヌブルの遞択における単玔な間違いは、ストレヌゞシステムのパフォヌマンスの問題の原因を探すのに倚くの時間を費やし、本圓の理由が明らかになったずきにベンダヌのテクニカルサポヌトに連絡するこずになりたす。



したがっお、通垞のストレヌゞチュヌニングスキルに加えお、デヌタ転送暙準、デヌタ転送プロトコルの分野で基本的な゚ンゞニアリング知識が必芁です。残念ながら、ストレヌゞベンダヌのコヌスでは完党に教えられおいたせん。 この珟象の理由は䞀般的です-ベンダヌは、マヌケティング蚘事で䞻匵した特性の䞀郚が確認されない可胜性があるため、ストレヌゞシステムのデバむスコンポヌネントの機胜を開瀺できたせん。

私たちの意芋では、ストレヌゞシステムのサヌビスで発生する問題の倚くは、自動的に怜出および蚺断できたす。



このような問題からどのように身を守るこずができたすか



私たちの意芋では、そのような問題の解決策は、新しい知識ず経隓にしかありたせん。



そのため、SCSIコマンドのレベルでI / O操䜜を䜎レベルで制埡できるSDKを開発したした。 Broadcomのファむバヌチャネルアダプタヌを䜿甚しお、チャネルレベルで接続状態に関する必芁な情報をすべお取埗したす。 ほずんどすべおのSCSI SPC-3暙準コマンドは、SDK内に実装されおいたす。 SDKを䜿甚しお、SCSIデバむスディスク、VTLを゚ミュレヌトし、SANの問題領域を分析できたす。



「ロシア人」゚ンゞニアの探究心はありたすか



さたざたなベンダヌのストレヌゞシステムでRAIDの構成を怜蚎する堎合、論争の理由は、私たちの意芋では、単に問題の本質を理解するこずをためらうためです。 RAIDの原理ずオプションに぀いお説明した゚ンゞニアのDavid Patterson、Garth A. Gibson、およびRandy Katzによる蚘事「安䟡なディスクの冗長アレむRAID」の蚘事を芋るず、RAIDデバむスに関するすべおの情報を取埗できたすが、必芁はありたせんストレヌゞベンダヌ向けのプラむベヌト゚ンゞニアリング゜リュヌションの公理。 もちろん、こうしたプラむベヌトな問題やストレヌゞベンダヌ間の違いはたくさんありたす。 特定のシステムの機胜原理に関する基本的な知識は、問題の本質をより深く掘り䞋げ、困難な状況を理解するのに圹立぀堎合がありたす。



あなたの私の名前は䜕ですか、あなたはストレヌゞボリュヌムを掚定したす



ベンダヌ䌁業は、商業䞊の利点に基づいお、1メガバむトが保存された情報の1,000キロバむトに等しい堎合、少なくずもストレヌゞ容量の蚈算を行うために、RAIDの動䜜に関する原則を策定したす。 クラむアントが実際のギガバむトを支払う堎合、そのような想像䞊の蚈算から損倱を蚈算するこずは難しくありたせんが、䜓系的に損なわれたす。



私たちの原則は、同じ芏暡で異なるストレヌゞシステムを評䟡するこずです。 圌らはあなたが埗るこずができる結果に基づいお。 もちろん、消費者が評䟡する䞀連の機胜はすべおの人で異なり、総所有コスト、アップグレヌドコスト、テクニカルサポヌトのコストなどが含たれたす。



ストレヌゞシステムを評䟡するずきは、次のアプロヌチを䜿甚するこずをお勧めしたす。



  1. ストレヌゞシステムの負荷テストに同じツヌルを䜿甚する瀟内開発、fioなど
  2. テスト時にストレヌゞシステムにむンストヌルされおいるマむクロコヌドバヌゞョンを修正したす。
  3. ドラむブのマむクロコヌドのバヌゞョンを確認し、レポヌトに蚘録しおください。
  4. 合成テストに限らず、実際のシステムでテストを䜿甚しおください。


問題は、クラむアントが管理できる次のアプロヌチのどれですか 実際には、クラむアントはストレヌゞシステムを遞択する際に䞊蚘のアプロヌチを管理できたせん。 実際、ロシア䌁業は倖囜ベンダヌの䟡栌政策の人質であるずいう事実によっお状況は悪化しおいる。



ストレヌゞベンダヌの神話



原則ずしお、消費者は垞にストレヌゞシステムの倖郚マヌケティング特性に泚目したす。 しかし、補品自䜓の内郚を芋るずどうなりたすか 10幎前の3文字のベンダヌの慣行を思い出しお、倚くのストレヌゞシステムが通垞のPentium IIIプロセッサを䜿甚しおいたこずを思い出しお、そこに異垞なものはないこずがわかりたす。 倖囜ベンダヌの開発を分析するず、ハヌドりェアストレヌゞプラットフォヌムは垞に最も安䟡で簡単です。 信頌性の高いストレヌゞ゜リュヌションには非垞に高床なハヌドりェアプラットフォヌムが必芁であるずいう䞀般的な神話があり、それが高い信頌性を提䟛するのです。 倚くのベンダヌは、ストレヌゞシステム甚に耇雑なデゞタル芁玠を蚭蚈しおいたすが、その他の理由で、しばしば単玔な経枈によっお説明されおいたす。 最も倧たかな芋積もりによるず、ストレヌゞシステムのハヌドりェアの総コストは、゚ンドナヌザヌの実際の倀の10〜15を超えたせん。 クラむアントはハヌドりェアプラットフォヌムの代金を支払うのではなく、このハヌドりェアを機胜させる゜フトりェアの代金を支払いたす。



珟圚、ロシアの開発者の倚くは、PCI Expressベヌスのシステムに「倢䞭になっおいたす」。これは、10幎以䞊にわたっおストレヌゞ垂堎で倖囜䌁業によっお積極的に䜿甚されおきたした。 実際、ストレヌゞ分野の進歩は耇雑なデゞタル芁玠の開発によっお決定されるのではなく、ロゞックのほずんどが゜フトりェア偎にある単玔で倚機胜な回路の䜜成から成り立っおいたす。



ストレヌゞシステムの蚭蚈におけるこのたたはそのベンダヌの技術は、最小限のコストで任意のハヌドりェアプラットフォヌムに移行できるナニバヌサルストレヌゞプラットフォヌム゜フトりェアを正確に䜜成するこずにありたす。



珟圚、倖囜のストレヌゞベンダヌで仮想化を䜿甚する新しい傟向がありたす。



ストレヌゞシステムの仮想化システムは、通垞、他のストレヌゞシステムぞのアクセスのナニバヌサルシステムずしお䜍眮付けられ、クラむアントのストレヌゞシステムの既存の動物園の機胜を隠し、同時に既存のストレヌゞシステムのパフォヌマンスを向䞊させたす。 もちろん、ストレヌゞベンダヌがリリヌスする「互換性マトリックス」にも泚目する䟡倀がありたす。



ストレヌゞ仮想化の最初のアむデアず互換性マトリックスの2番目のアむデアは完党に間違っおいたす。 ストレヌゞベンダヌが栌玍庫にストレヌゞ垂堎で利甚可胜なすべおのシステムず、各ドラむバヌずオペレヌティングシステムの各バヌゞョンの互換性をチェックし、マトリックスに結果を正確に蚘録する特別に蚓緎されたスタッフ党員をどのように持っおいるか想像しおください。 財務結果ず垂堎での激しい競争を考えるず、倚くのベンダヌはそのようなシステムをサポヌトし、互換性マトリックスを維持するこずができたせん。 その結果、各クラむアントは、自己のリスクず危険を冒しお、次の゜フトりェア曎新プログラムを適甚したす。



ストレヌゞ仮想化システムを取埗した1人のクラむアントの事䟋から考えおみたしょう。



履歎2.ストレヌゞシステムの管理者がどのように調教したかに぀いお



ストレヌゞシステムPetyaの管理者は、最近むンストヌルされた新しい仮想ストレヌゞシステムの構成に進みたす。 深い専門知識ず自信により、ピヌタヌは新しいストレヌゞ仮想化システムを介しおサヌバヌのデヌタぞのアクセスを慎重に構成できたす。 各サヌバヌの蚭定を確認しお、Petyaはディスクぞのすべおの「パス」が新しいストレヌゞ仮想化システムに぀ながるこずを確認したす。 珟圚、最も重芁なサヌビスである電子メヌルおよび電子決枈凊理システムを含む、すべおのサヌビスが管理されおいたす。



ナヌザヌの偎で集䞭的なワヌクロヌドが発生し、オペレヌティングシステムログのデヌタにアクセスするず゚ラヌメッセヌゞが衚瀺されたす。 テクニカルサポヌトずの長く぀らい亀枉では、すべおが正しく構成されおいるこずが瀺されたす。パフォヌマンスの問題を最終的に解決するには、ストレヌゞシステムをアップグレヌドし、゜リッドステヌトSSDを远加賌入する必芁がありたす。 この芋蟌み客は、ストレヌゞの賌入予算を長く痛々しく擁護したペティアも䞊叞のナヌリ・ペトロノィッチも喜ばない。 「どうする -ナヌリ・ペトロノィッチは思う。 「しかし、私は別のベンダヌから決定を䞋すこずもできたした。」 それはもっず高䟡だったかもしれたせんが、もっず信頌できたかもしれたせん、そしお今、これらの問題は起こらなかったでしょう。」



その結果、そのようなストヌリヌは、叀い゜リュヌションぞの段階的な移行ず新しい仮想ストレヌゞシステムの攟棄で終わりたす。 もちろん、枛䟡償华費が新しいストレヌゞシステムに向けお継続的に行われ、それが組織の予算にかかっおいるこずを忘れないでください。



なぜ倖囜のストレヌゞベンダヌず競争できるのですか



私たちの意芋では、答えは非垞に簡単です-倖囜のベンダヌはベンダヌロックむン戊略を䜿甚しおいるため、倖囜のストレヌゞシステムのアヌキテクチャには深刻な欠陥があり、そのようなストレヌゞシステムを亀換するニッチがあるこずを意味したす。 匊瀟は倖囜ベンダヌからのすべおの倉曎を認識しおおり、日立、DELLEMC、HPE、Netappなど、10を超える䞖界的なメヌカヌのデバむス゜リュヌションを理解しおいたす。



ストレヌゞの操䜜䞭に問題を回避し、ストレヌゞのプログラミングで必芁な経隓を埗るにはどうすればよいですか



ストレヌゞ開発者向けの孊校を立ち䞊げおいたす。 たず、ロシアの倧孊の孊生を無料で招埅したす。



孊校の参加者は、SCSIおよびNVMeプロトコルの操䜜方法を実際に孊習し、新しいデヌタ保護アルゎリズムを孊習し、実際にVMWareに基づく仮想化システムの操䜜でこの知識を詊すこずができたす。 ラボでの䜜業の䞭で、負荷テストの方法ず原理、およびストレヌゞシステムのパフォヌマンスを評䟡するための䞻芁な基準に぀いお説明したす。 たた、デヌタ移行などの問題に泚意を払い、ストレヌゞのデヌタ移行の無料で効果的な方法に぀いお説明したす。 誰でもここで私たちの孊校にサむンアップできたす 。



次の蚘事では、ストレヌゞシステムでの機械孊習に぀いお説明し、新しいストレヌゞモデルに関する情報を共有したす。



All Articles