重耇排陀に関する8぀の神話

すべおの神話を怜蚎し、デヌタセットの重耇排陀に関する真実がどこにあるかを知る時が来たした。











重耇排陀テクノロゞヌは叀くから知られおいたしたが、珟圚では最新のデヌタアレむで䜿甚されおいるテクノロゞヌによっおのみ、再生が可胜になりたした。 珟圚、すべおの最新のデヌタ配列で重耇排陀が䜿甚されおいたすが、配列内にこの関数が存圚しおも、デヌタに特に倧きな利点があるずは限りたせん。

残念ながら、倚数の管理者が「信念を持ち」、重耇排陀には無限の可胜性があるず考えおいたす。



ティア1ストレヌゞシステム、 アヌカむブストレヌゞ、たたはオヌルフラッシュハむブリッドストレヌゞシステムの管理者であるかどうかは関係ありたせん。ストレヌゞシステムを蚭蚈たたは操䜜する際の迷惑なミスを回避するために、重耇排陀の神話や䌝説を探求するこずに関心がありたす。



デヌタ削枛率奇跡はありたせん



重耇排陀は、生産的なデヌタを栌玍するアレむずデヌタバックアップを栌玍するアレむの䞡方で利甚可胜になりたしたが、これらのアレむの重耇排陀係数は完党に異なる堎合がありたす。 アヌキテクトは、アヌカむブで達成された係数を生産的なストレヌゞに適甚できるず非垞によく信じおいたす。



重耇排陀は、有名なメヌカヌの倚くのアレむに存圚する自動プロセスですが、取埗できる朜圚的な係数は、タむプのアレむによっお異なりたす。 その結果、たずえば、100TBの配列が必芁な堎合、101の係数を考慮するず、10TBのストレヌゞが埗られたす。たずえば、係数を21ず評䟡するず、50TBのストレヌゞが埗られたす-最終的に、これらのたったく異なるアプロヌチは、たったく異なる賌入コストに぀ながりたす 実際には、特定の量の特定のモデルを優先するかどうかを決定する前に、生産性デヌタで取埗できる係数を理解する必芁がありたす。



さたざたな運甚ストレヌゞおよびバックアップストレヌゞタスクのデヌタアレむの構成を構築する堎合、重耇排陀係数を正しく決定するのが困難になるこずがよくありたす。 重耇排陀のためのアレむのアヌキテクチャ蚭蚈の耇雑さに興味がある堎合、この議論はあなたのためです。



最䜎限、基本的なレベルで以䞋の8぀の神話を理解するこずで、重耇排陀を意識的に理解し、デヌタの係数を評䟡できたす。



神話1。 重耇排陀率が高いほど、ストレヌゞのメリットが倧きくなりたす



あるベンダヌが501の重耇排陀係数を提䟛しおいる堎合、101の代替案よりも5倍優れおいるずいうのは本圓ですか 総所有コストを確認しお比范する必芁がありたす 重耇排陀はリ゜ヌス芁件を削枛したすが、朜圚的なコスト削枛は䜕ですか 101を䜿甚するず、保存されたデヌタのサむズ瞮小率を90削枛できたすが、501の係数では、このむンゞケヌタヌが8増加し、98の瞮小率が埗られたす䞋のグラフを参照。 しかし、これは違いのわずか8です...



䞀般的に、重耇排陀係数が高いほど、 収益の枛少の法則に埓っお、デヌタ量を削枛する利点は少なくなりたす 。 収益の枛少の法則の意味の説明は、次のようになりたす。1぀の芁因重耇排陀係数などの远加適甚コストは、䞍倉の量の別の芁因デヌタ量などず組み合わされたす。 その結果、珟圚のボリュヌムでの新たな远加コストは、リ゜ヌスの節玄をこれたでよりも少なくしたす。



たずえば、事務員が働くオフィスがあるずしたす。 時間が経぀に぀れお、郚屋のサむズを拡倧せずに店員の数を増やすず、店員は互いの足䞋に邪魔され、コストが収益を䞊回る可胜性がありたす。









図 1重耇排陀率の向䞊ずストレヌゞの削枛



神話2。 「重耇排陀」ずいう甚語の明確な定矩がありたす



重耇排陀は、プヌルから重耇デヌタシヌケンスを削陀するこずでストレヌゞを削枛したす。 重耇排陀は、ファむルレベル、ブロックレベル、たたはアプリケヌションレベルたたはコンテンツレベルで実行できたす。 ほずんどの補品は、重耇排陀ず圧瞮を組み合わせお、ストレヌゞをさらに削枛したす。 䞀郚のメヌカヌはこれらの甚語を共有しおいたせんが、䞀郚のメヌカヌはそれらを分離しお、基本的に重耇排陀ず圧瞮の単なる別名である圧瞮などの甚語を導入しおいたす。 残念ながら、重耇排陀の単䞀の定矩はありたせん。 フィリピンレベルでは、重耇排陀を䜿甚しおストレヌゞおよびバックアップシステムのディスクリ゜ヌスをどのように節玄できるかが重芁になりたす。 以䞋にこのトピックを明らかにしたす。



HPEのストレヌゞおよびバックアップシステムのラむンに぀いお蚀えば、ストレヌゞシステムずバックアップシステムの䞡方に、顧客がディスクリ゜ヌスを節玄できる興味深い機胜があるこずに泚意するこずが重芁です。



3PARアレむの運甚デヌタストレヌゞシステムでは、生産性の高いアレむ䞊のデヌタ量を削枛できるナヌティリティずメカニズムの党範囲が開発されおいたす。

この耇合䜓はHPE 3PAR Thin Technologiesず呌ばれ、いく぀かのメカニズムで構成されおいたす。





これら3぀のテクノロゞヌはすべお無料で利甚でき、 これらのテクノロゞヌの詳现に぀いおは 、お客様がむンストヌルしたものを含め、3PARストレヌゞシステムの時間制限やボリュヌム制限はありたせん。









図 3PARアレむの2぀のシンテクノロゞヌ



神話3。 メむンアレむの重耇排陀係数は、バックアップアレむず同じです。



ストレヌゞ開発者は、さたざたな重耇排陀アルゎリズムを䜿甚したす。 それらのいく぀かは倧きなCPUリ゜ヌスを必芁ずし、他のものよりも耇雑です。したがっお、重耇排陀係数が非垞に倧きく倉化するこずは驚くべきこずではありたせん。



ただし、重耇排陀率に圱響を䞎える最倧の芁因は、重耇デヌタの量です。 このため、同じデヌタ毎日、毎週、毎月、四半期、毎幎の耇数のコピヌを含むバックアップシステムには、重耇排陀係数が非垞に高くなっおいたす。 オンラむンストレヌゞシステムにはほが䞀意のデヌタセットがありたすが、ほずんどの堎合、重耇排陀係数は䜎くなりたす。 運甚デヌタの耇数のコピヌを生産的なアレむにたずえば、クロヌンの圢で保存するず、重耇排陀係数が増加したす。 ストレヌゞスペヌス削枛メカニズムが適甚されたす。



したがっお、オンラむンストレヌゞアレむの堎合、51の比率は、バックアップシステムの301たたは401の比率を持぀のも玠晎らしいこずです。この比率は、このようなアレむに栌玍される生産デヌタのコピヌ数に䟝存するためです。



HPE補品を怜蚎する堎合、HPE 3PARのオンラむンストレヌゞのアレむでは、重耇したシヌケンスの怜玢たずえば、仮想マシンの初期化やスナップショットの䜜成時は、各アレむコントロヌラヌにむンストヌルされた特別なASICチップで「オンザフラむ」で実行されたす。 このアプロヌチにより、他のより重芁なタスクのためにアレむの䞭倮プロセッサをアンロヌドでき、アレむが負荷の䞋で「沈む」こずを恐れるこずなく、すべおのタむプのデヌタの重耇排陀を有効にできたす。 3PARアレむでの重耇排陀に぀いお詳しく読むこずができたす 。









図3 3PARアレむの重耇排陀は専甚のASICで実行されたす



たた、HPEポヌトフォリオには、可倉ブロックレベル-HPE StoreOnceでのオンラむン重耇排陀でデヌタをバックアップするためのハヌドりェアシステムがありたす。 システムオプションは、初期レベルから䌁業レベルたでのすべおの顧客を察象ずしおいたす。









図 4 HPE StoreOnce Backup Systemポヌトフォリオ



StoreOnceバックアップシステムの利点に぀いおは、 他の蚘事をご芧ください。

HPE 3PARずStoreOnceの組み合わせにより、バックアップ゜フトりェアたたは専甚バックアップサヌバヌを䜿甚せずに、本番アレむからバックアップシステムにデヌタを転送するプロセスを簡玠化および高速化できるこずは、お客様にずっお興味深いかもしれたせん。 このバンドルはHPE StoreOnce RMCず呌ばれ、詳现に぀いおは蚘事をご芧ください 。



神話4。 すべおのデヌタは同じです。



間違いないはずです-すべおのデヌタが異なっおいたす。 異なる条件の同じアプリケヌションのデヌタでさえ、同じアレむ䞊で異なる重耇排陀係数を持ちたす。 特定のデヌタの重耇排陀係数は、さたざたな芁因に䟝存したす。





以䞋の衚は、デヌタのタむプに応じお、重耇排陀係数の衚面的な掚定倀を瀺しおいたす。 メむンデヌタ配列の重耇排陀係数は、垞にバックアップ配列の重耇排陀係数よりも䜎いこずに泚意しおください。









図 5デヌタタむプずバックアップポリシヌに応じた重耇排陀係数の掚定



神話5。 䞀貫性のないデヌタ型をグルヌプ化するず、重耇排陀が増加したす



理論的には、重耇排陀のために共通のストレヌゞプヌルに完党に異なるタむプのデヌタを混圚させるこずができたす。 䞀意のデヌタの非垞に倧きなセットがあるず感じる堎合がありたす。したがっお、このプヌルで既に曞き蟌たれたブロックたたはオブゞェクトを芋぀ける可胜性が高くなりたす。 実際には、このアプロヌチは、同じデヌタセットが保存されおいる堎合でも、デヌタ圢匏が異なるため、デヌタベヌスずExchangeなどの無関係なデヌタタむプ間では機胜したせん。 このような絶えず成長するプヌルはより耇雑になり、重耇するシヌケンスを怜玢するのにより倚くの時間が必芁になりたす。 ベストプラクティスは、デヌタタむプごずにプヌルを分割するこずです。



たずえば、1぀の仮想マシンを重耇排陀する堎合、いく぀かの係数を取埗したす。この仮想マシンの耇数のコピヌを䜜成し、このプヌルで重耇排陀する堎合、重耇排陀係数は増加したす。係数はさらに増加し​​たす。









図6重耇排陀係数の、プヌル内の仮想マシンの数ずデヌタブロックのサむズぞの䟝存性。



神話6。 最初のバックアップには、予想される重耇排陀率が衚瀺されたす。



この誀った意芋は、メむンアレむずバックアップシステムの係数を比范するずきに珟れたす。 デヌタのコピヌを1぀だけ保存するず、重耇排陀係数が1より倧きい堎合がありたす。 珟圚のデヌタベヌスのバックアップなど、非垞に類䌌したデヌタのコピヌの数を増やすず、この比率は倧きくなりたす。



以䞋のグラフは、非垞に兞型的な重耇排陀係数曲線を瀺しおいたす。 このグラフのアプリケヌションはSAP HANAデヌタベヌスですが、ほずんどのアプリケヌションは同様の曲線を瀺しおいたす。 最初のバックアップでは重耇排陀が行われおいたすが、デヌタ圧瞮により倧幅な節玄が実珟しおいたす。 プヌル内のデヌタのコピヌの保持を開始するずすぐに、プヌルの重耇排陀係数が増加し始めたす青い線。 個々のバックアップ係数は、2番目のコピヌが䜜成された埌に䞊昇したすオレンゞ色の線。 ブロックレベルでは、最初ず2番目のバックアップは非垞に䌌おいたす。









図 7バックアップコピヌ数の増加に䌎う重耇排陀係数の増加のグラフ 詳现に぀いおは、ドキュメントを参照 。



神話7。 重耇排陀を増やすこずはできたせん



重耇排陀のレベルを人為的に高める方法はないず䞻匵するのは単玔です。 別の質問-なぜですか マヌケティングの数倀を衚瀺する堎合-これは1぀のこずであり、効果的なバックアップスキヌムを䜜成する必芁がある堎合-これは別です。 目暙が合成の最高の重耇排陀係数を持぀こずである堎合、できるだけ同じデヌタのコピヌをできるだけ倚く保存する必芁がありたす。 もちろん、これにより保存されるデヌタ量が増加したすが、重耇排陀係数は急䞊昇したす。



バックアップポリシヌを倉曎するず、完党なバックアップポリシヌず、完党バックアップず増分バックアップおよび差分バックアップの組み合わせを比范する実際のデヌタタむプの䟋に芋られるように、重耇排陀率にも確実に圱響したす。 以䞋の䟋では、終日バックアップのみを䜿甚しお最適な比率が取埗されたす。 ただし、同じデヌタでは、3぀のアプロヌチすべおでストレヌゞボリュヌムが倧きく異なりたす。 したがっお、バックアップぞのアプロヌチを倉曎するず、重耇排陀率ず保存されるデヌタの物理量に倧きく圱響する可胜性があるこずを理解する必芁がありたす。



神話8。 重耇排陀係数を事前に予枬する方法はありたせん



すべおの環境は独自のものであり、実際の重耇排陀係数を正確に予枬するこずは非垞に困難です。 それにもかかわらず、バックアップシステムのメヌカヌは、デヌタの皮類、バックアップポリシヌ、および保存期間のアむデアを提䟛する基本的なストレヌゞシステムおよびバックアップシステム甚の小さなナヌティリティのセットを䜜成したす。 これらのナヌティリティは、予想される重耇排陀率に関する掞察を提䟛したす。



補造業者は、ほが同様の環境および業界セグメントで他の顧客から取埗した係数に぀いおも考えおおり、この情報を䜿甚しお予枬を行うこずができたす。 これは、デヌタで同様の係数を取埗するこずを保蚌するものではありたせんが、少なくずもこれらの数倀を確認する䟡倀はありたす。



ただし、重耇排陀係数の最も正確な予枬は、実際のデヌタのテスト䞭に取埗されたす。









図 8特定の顧客のデヌタのバックアップポリシヌに応じお重耇排陀係数ず占有デヌタ量が倉化する



HPEには、お客様が必芁ずするストレヌゞシステムのボリュヌムをある皋床の仮定で予枬できるナヌティリティずサむザヌのセットがありたす。



  1. オンラむンデヌタストレヌゞの堎合、 3PARに切り替えた堎合のアレむの珟圚の廃棄を評䟡し、スペヌス節玄を芋積もる無料のプログラムがありたす。



  2. アレむがHPEテクニカルサポヌトにステヌタスに関する情報を送信できる堎合、皌働䞭のアレむ䞊のリ゜ヌスの䜿甚率を評䟡し、すでにむンストヌルされおいるシステムのデヌタの増加を予枬するには、 www.storefrontremote.com



  3. バックアップシステムの䜿甚率を評䟡するための同様のプログラム 。


たた、シミュレヌタモヌドの3PARシステムで重耇排陀をオンにした埌の掚定ボリュヌムを掚定するこずもできたす。このため、ホストに察しお透過的にオンラむンで実行される3PARで評䟡コマンドを実行する必芁がありたす。



checkvv -dedup_dryrun {  }
      
      





そしお、予備評䟡を取埗したす。











そのため、重耇排陀の抂念の背埌に魔法はありたせん。䞊蚘の神話を暎くこずで、デヌタに䜕ができるかをよりよく理解し、アレむの䜿甚率を予枬するこずができたす。



フラッシュドラむブでのSSDボリュヌムの珟圚の増加ず1 GBのストレヌゞコストの削枛およびコストはすでにGBあたり1.5ドルに盞圓するにより、重耇排陀の効率に関連する問題がオンラむンストレヌゞのバックグラりンドに抌し蟌たれおいたすが、バックアップシステムにたすたす重芁になっおいるこずに泚意しおください。



ちなみに、将来の代替ビゞョン重耇排陀なしがありたすWikibonは、重耇排陀ず圧瞮率を増やすよりも同じデヌタのコピヌを削陀する方が効果的であるず考えおいたす レポヌトの䞭倮にあるリンクを参照性胜、むンフラストラクチャ党䜓の倉曎、アプリケヌション凊理、分析ずデヌタの同時操䜜のルヌルにより、パフォヌマンス優れたSLAツヌルの実装時ず信頌性が䜎䞋しないようにしたす。



そしお、最も重芁なこずは、これらすべおが゚コシステム党䜓に実装されおいる堎合-゜フトりェア開発者、ベンダヌ、およびCIOにずっおは、数幎埌には重耇排陀よりも倧きな節玄になりたす。



思考の孊校が勝぀-時間は教えおくれたす。



䜿甚材料



All Articles