Archiware P5 Backupの合成方式とプログレッシブ方式の説明

Archiware P5 Backupには2つの特別なバックアップ戦略があり、「フル」バックアップが不可能な状況をサポートします。このブログ記事では、合成バックアップとプログレッシブバックアップの方法について詳しく説明します。

バックアップの基本

より複雑なバックアップ技術を理解するために、まず「フルバックアップ」と「増分バックアップ」の概念から説明しましょう。

私たちは重要なデータやストレージを事故や災害から守るためにバックアップを取ります。
定期的に、おそらく毎日、バックアップタスクが実行され、前回実行したときから変更されたものがあれば、保存されているバックアップを更新する必要があります。
伝統的にこのプロセスは、まずすべてをバックアップすることから始まります。
これはフルバックアップと呼ばれ、時間がかかるだけでなく、すべてのファイルが読み込まれバックアップに追加される間、ソースストレージのパフォーマンスに影響を与えるため、不都合が生じます。
そのため、一般的にフルバックアップは必要な頻度でのみ行いたいのです。

フルバックアップが完了したら、増分バックアップを使用します。増分バックアップは、保存されているバックアップの現在のファイルセットと前回のバックアップを比較し、差分のみを保存します。
そのため、増分バックアップはより迅速で便利です。バックアップ・インデックスには、これまでに保存されたすべてのファイルに関する情報があるので、これをライブ・ファイルシステムと比較して、保存が必要なファイル・セットにたどり着きます。

しかし、フルバックアップを1回しか取らず、その後は永久に増分バックアップに戻すとした場合は、削除されることはなく、毎日増分バックアップからデータを追加することになるため、バックアップは時間の経過とともに、より多くのストレージ容量を必要とすることになります。
リストアに必要なファイルは、バックアップのどれかに含まれている可能性があるため、すべてのバックアップを保持する必要があります。

増え続けるストレージを回避する従来の方法は、定期的にフルバックアップタスクを繰り返すことです。こうすることで、バックアップに区切りをつけます。こうして新しい "バックアップサイクル "が始まるのです。
2回目のフルバックアップが実行されると、以前のバックアップに割り当てられたすべてのストレージを今後のバックアップに再利用することができます。
この戦略のバリエーションは、商用の環境でよく使われています。

フルバックアップの回避

P5には、フルバックアップが不可能な場合のために、合成バックアップとプログレッシブバックアップの両方の方法が実装されています。以下に説明するように、特定のケースで役に立ちます。

合成バックアップは、バックアップインデックスを巧みに利用することで、新しいバックアップストレージメディアにフルバックアップを合成する古いアプローチです。
ソース・ストレージが比較的低速で、従来のフルバックアップの完了に時間がかかる場合に有効です。このプロセスでは、バックアップ対象のファイルシステムの最新の状態をバックアップ・インデックスで照会します。
そして、このファイルのリストを取得し、バックアップ・ストレージから読み出し、新しいバックアップ・ストレージに書き出すことで、低速なソース・ディスク・ストレージから読み出す必要なく、フルバックアップと同じものを作成します。

この読み書きは並行して行われます。したがって、LTOテープの場合、このプロセスには2台のLTOテープ・ドライブが必要であり、1台のテープを読み出しながら、もう1台のテープを書き込むことができます。
P5では、1つのテープから別のテープにデータをストリーミングするため、途中に小さなメモリ・バッファが必要なだけです。新しいフルバックアップの動作は、従来のバックアップと同じです。
さらに増分バックアップを、通常の方法でフルバックアップの「上に」実行することができます。

synthetic 1

プログレッシブ・バックアップ

これはフルバックアップを完全に排除する新しいアプローチです。アクセスに時間がかかるバックアップストレージ(クラウドストレージなど)に書き込む場合や、特に大きなデータセットを保護する場合に便利です。
増分バックアップを実行するたびに追加データを保存し、フルバックアップが不要になるようにします。この機能には2つのパラメータが必要です:

  • バックアップの'保持期間'、バックアップされたファイルがソースストレージから現在のバージョンでなくなったときに、バックアップにどれくらいの期間残すか。バックアップは常にソース・ストレージから現在のファイルを保持しますが、変更されたファイルや削除されたファイルはどの程度遡ってバックアップに保持すべきでしょうか?
  • バックアップを実行するのに便利な「バックアップウィンドウ」が毎日定義されます。バックアップは、その日に変更されたものを保存するだけでなく、追加作業(下記を参照)を行うため、必要なタスクをすべて完了できるよう、毎日実行するための追加時間を確保する必要があります。これらのバックアップ・ウィンドウには開始時刻と期間があります。ウィンドウが終了すると、バックアップは次の実行まで適切に終了します。

増分バックアップの際に、どのような追加データを保存する必要があるのかを理解するためには、P5内で "コンテナ "として構成されたディスクやクラウドストレージの場合、バックアップデータは個別のボリューム(LTOテープの場合)または "チャンク "に保存されることを理解する必要があります。
これらのボリュームまたはチャンクは、不要になった最も古いデータをバックアップから削除するために、その全体をリサイクルして再利用する必要があります。

P5は、バックアップ構成で設定された保持期間を受け取り、最も古いストレージボリュームまたはチャンクをバックアップから削除しようとします。
ここで保存されたデータの一部は、保存されるストレージ上にファイルがまだ存在するため、バックアップでまだ必要とされます。
そのデータは、進行中の増分バックアップの一部として、古いボリューム/チャンクから読み取られ、現在のボリューム/チャンクに書き込まれます。

progressive

プログレッシブ・バックアップは、P5を使用してディスクまたはクラウドストレージにバックアップする場合に必要で、ストレージはバージョンX以降のデフォルトである'コンテナ'を使用して構成されます。

結論

読み取り速度の遅いストレージをバックアップしたり、書き込み速度の遅いバックアップストレージに書き込んだりするため、商用の環境ではフルバックアップが実行できないことがよくあります。
P5 Backupには、柔軟性を求める管理者にオプションを提供する高度なバックアップ技術が含まれています。LTOテープやVTLへのバックアップでは、フルバックアップを一定間隔で繰り返す「伝統的な」手法にこだわることをお勧めします。
これにより、時間の経過とともに古いテープ/VTLボリュームがリサイクルされ、新しいデータへの移行が可能になります。

ソース・ストレージからの読み込みに時間がかかる環境では、LTOテープで合成バックアップを使用することで、ソース・ストレージからの読み込みを全く必要とせずにフル・バックアップを作成することができます。

P5コンテナ・ストレージ・フォーマットを使用してクラウドやディスクに書き込む場合、プログレッシブ・バックアップを取ることができ、増分バックアップの一部として追加データを保存することで、繰り返しフルバックアップを取る必要性を避けることができます。

合成バックアップとプログレッシブ・バックアップ方式により、P5 Backupはデータを保護するための特に強力で柔軟なソフトウェアとなっています。

https://blog.archiware.com/blog/synthetic-and-progressive-backup-methods/