見出し画像

そのバックアップは無駄!?効率的なバックアップを実現する「重複排除」とは?

はい、こんにちは。松井真也です。『ゼロトラスト用語辞典シリーズ』と題してブログを更新しております

今回のテーマは、「重複排除」です!なんのこっちゃいと思うかもしれませんが、ゼロトラストとも関連する新しい「バックアップ技術」の一つです。効果的で効率的なバックアップはランサムウェアに対抗するのに不可欠ですからね!

では、早速見ていきましょう!

効率的なデータ管理の鍵を握る「重複排除」

ビジネスで扱うデータ量が年々増加しています。企業においてデータの保全にかかるコストを抑えつつ、ランサムウェアに備えることは重要な課題でございます。

そのために注目されているのが「重複排除」という技術です。

簡単にいえば、重複排除とは、保存するデータの重複を削減し、ストレージ容量を節約する技術です。データを細かい単位(ブロック)に分割し、重複するブロックを一度だけ保存します。これにより、同じデータを何度も保存する必要がなくなり、ストレージ容量を大幅に節約できます。

なにやら当たり前のように聞こえますが、以前はそうではなかったのですよ。

ファイルバックアップとの違い

「あるファイルに変更があったら、そのファイル全体を差分としてバックアップする。」というのは自然で無駄がないように見えますね。この方法を「ファイルバックアップ」といいます。

ところが、そのファイルの変更が微修正だったとしたら、そのファイルが占めるファイル容量の大半は無駄になってしまいます。

一方、重複排除で取り入れられている方法は、「ブロックバックアップ」です。こちらは、ファイルを細かいブロックに分割し、ブロック単位で保存する方法です。ファイル全体を保存する必要がないため、ストレージ容量をより効果的に節約できます。

さらに言えば、ファイル全体を保存するのに比べて、バックアップ時間も短縮できますね!

これにより、バックアップが効率化されます。なんとなく分かってきましたね!

重複排除の仕組みと効果

もう少し、重複排除の仕組みを掘り下げましょうか。仕組みは思ったよりもシンプルです。

まず、データを細かいブロックに分割し、各ブロックにインデックスを付けます。そして、重複するブロックを検出し、一つにまとめて保存します。

例えば、内容の重複が多い文書ファイルが複数の場所に保存されていても、その内容が完全一致する部分を一度だけ保存し、異なる部分のみを別に保存することができます。そんなことできるんだ…とちょっと感動的です!

また、複数の仮想マシン間で重複するデータを一つにまとめて保存することもできます。これもスゴイことですね…。

これにより、仮想マシンのバックアップデータ量を削減し、ストレージ容量を効果的に利用することができます。例えば、同じOSやアプリを複数の仮想マシンで使用している場合、その共通部分を一度だけ保存することで、重複データを削減します。素晴らしいかな、仮想化技術!

世代間バックアップで力を発揮

ということを踏まえつつ、重複排除はどんなバックアップで力を発揮するでしょうか?

実は、重複排除は、「世代間バックアップ」で効果を発揮します。世代間バックアップでは、異なる世代のデータの重複を排除し、変更のないデータの重複部分を保存しないようにします。ちょっとだけ変更を繰り返すことって多いですからね。そのたびにファイルバックアップしては非効率です。



ということで、本日はバックアップの「重複排除」のお話でした。効率的で安全なデータ管理を実現しましょう!

この記事が気に入ったらサポートをしてみませんか?