ストレージ容量やトラフィックの増大は、データバックアップ(レプリケーション)のコスト増やサービス停止時間の長期化などの問題を引き起こします。特にクラウドを用いたバックアップでは、ストレージ容量とトラフィックコストの削減が大きな課題です。この課題を解決する技術が重複排除技術であり、この技術はバックアップの効率化に大きなインパクトを与えます。そこで今回は重複排除技術と、最も効率が良い重複排除技術を採用しているQoreStorについて解説します。
バックアップと重複排除技術
データバックアップにはストレージやトラフィックなどの膨大なITリソースがかかるため、少しでもデータを減らすために重複排除技術が使われます。
重複排除技術とは、バックアップするデータを分析して、すでにバックアップしているデータと同じデータを取り除き、変更点のみをバックアップするための技術です。この重複排除技術は重複データ判定の単位によって「ファイル」、「固定長ブロック」、「可変長ブロック」に分けられます。
重複データ判定の単位が「ファイル」方式の場合、ファイル名が変更されただけでも、そのファイルを新たなバックアップ対象のデータとして認識します。そのため次に説明する「固定長ブロック」や「可変長ブロック」単位の重複排除技術に比べると、重複データの削減率はかなり劣ります。
「固定長ブロック」方式の場合、データを特定のブロックサイズに分割して、重複データかどうか判断します。ファイル方式よりデータ重複の判定範囲が細かく、別名で保存されたファイルや、ファイル名を変更したファイルを重複データと判断します。よって、ファイル方式に比べると重複データの削減率は大きくなります。ただし「固定長ブロック」のため、ファイルの途中にデータが追加されるとデータを分割するポイントがずれてしまうことから、以降のブロックでは重複データは別データとして認識されてしまいます。この弱点を克服する方式が、次に説明する「可変長ブロック」の方式です。
「可変長ブロック」方式ではデータパターンを参照しながらブロックサイズを調整するため、ファイルの途中にデータが追加されても、ブロックサイズを調整し、重複データを適切に認識します。この「可変長ブロック」が重複排除の削減率が最も高い方式で、QoreStorで採用しています。
バックアップのためのクラウド活用
データバックアップについて、従来はバックアップ用のサーバーやディザスタリカバリ用サイトを別に設けて、データの差分をバックアップする、あるいはデータレプリケーションをするケースが主流でした。しかし昨今は、バックアップでクラウドを活用するケースが増えています。
クラウドにバックアップを取得する場合に注意すべき点はトラフィックとストレージのコストです。バックアップデータをそのままクラウドに送信すると、膨大なトラフィックが発生し、帯域幅を圧迫します。またバックアップデータを保管するために、大きなストレージ容量をクラウドに確保しなければいけません。
トラフィックとストレージというITリソースを削減、あるいは効率的に利用するには重複排除技術が欠かせません。重複排除技術を用いることでデータの変更点だけがバックアップ対象となるため、ストレージとトラフィック双方のリソースが削減、効率化されます。
データの長期保管にクラウドを活用
コンプライアンス(法令遵守)や監査に対応するために、一部のバックアップデータは複数年にわたり長期保管することが要求されます。このような長期保管が必要なデータが満たすべき要件には、「保管コストを最小限に抑えること」と「必要な時にデータを速やかに取り出せること」が含まれます。これらの要件を満たしたデータの長期保管のためのアーカイブ先としてオブジェクトストレージが使われることが多くなってきました。
クラウドのオブジェクトストレージは保管コストの面で、オンプレミスのストレージに比べて優れています。長期保管が必要なバックアップデータは一定の期間が過ぎると、ほぼアクセスすることがなくなり、ストレージ容量を消費しているだけの状態となります。このようなアクセス頻度が非常に低いデータがオンプレミスのトレージを占め容量を圧迫してしまう状況はコスト面だけでなくITリソース管理の観点からも非効率です。
アクセス頻度が低く長期保管が必要なデータは、コスト面で優れているクラウドのオブジェクトストレージをアーカイブに活用してバックアップコストを抑える企業が増えています。一定期間過ぎたデータをクラウドに移す(アーカイブ)することで、オンプレミスのバックアップストレージ容量を抑えることができます。
クラウドにアーカイブしたデータはいつでも取り出せるよう、透過的に管理する必要があります。よって優れたバックアップ管理ソリューションの利用が欠かせません。
ストレージ容量とトラフィックコストを大きく削減するQoreStor
QoreStorはクラウドを活用したバックアップに最適なソフトウェアソリューションで、あらゆるバックアップソフトウェアに対応しています。そのため、既存の使い慣れた環境に重複排除技術を活用したストレージを簡単に構築できます。
またバックアップストレージのコスト面の課題も、弊社のQoreStorが解決します。QoreStorは可変長ブロック単位の重複排除技術によりバックアップデータを分析し、必要なストレージ容量を最大20分の1(95%)に削減します。また低速なWAN接続にも対応し、クラウドに構成されているQoreStorに重複排除された最小限のデータだけを転送します。重複排除技術はトラフィックを最大85%低減するため、トラフィックコストも大きく引き下げます。
クラウドに構成されたQoreStorには透過的なアクセスが可能なため、重要なアーカイブデータの場所や状態をいつでも確認可能です。監査対応など、法令を遵守するために必要なクラウドへのデータアーカイブにおいて、QoreStorは最適なバックアップソリューションと言えます。
まとめ
昨今の急激なデータ増加に伴い当然バックアップ対象データ量も増えています。また、バックアップデータは何世代にもわたって保持されるため、バックアップデータの肥大化とバックアップストレージ容量の圧迫が引き起こされます。この事態に対応する技術が重複排除技術です。重複排除技術を用いることで、バックアップ対象となるデータの保管量を削減し、バックアップストレージ容量が削減されます。対象データが削減されることでデータ転送量が抑えられWAN接続のトラフィックも削減します。弊社のQoreStorは重複データの削減率に最も優れている可変長ブロック単位の重複排除技術を採用しており、効率的なバックアップシステムの構築が可能です。
また、QoreStorはコスト面で優れているクラウドのオブジェクトストレージと連携させたデータアーカイブを実現します。クラウド上にアーカイブされたデータを透過的に管理しアクセス可能なアーカイブシステムを簡単に構築できます。さらにQoreStorはあらゆるバックアップソフトウェアに対応しているため、使い慣れた環境に簡単に導入できる点もポイントです。