バックアップに関する用語一覧

とても重要な仕組みですが、意外と触れる機会が少ないのがバックアップです。すでに構築されたシステムだと、よほどのメンテナンスやトラブルが発生しない限り、裏で粛々と動いているものだと思います。

そんなこともあり、私もすぐに思い出せないことがしばしばあります。という事で、特に重要なポイントをまとめておきたいと思います。

フルバックアップ

フルバックアップ(Full Backup)はその名の通り、すべてをバックアップする方法です。

例えば、日次バックアップを取っているシステムがあるとします。100GBのシステムがあったとするとその日のバックアップは100GBです。次の日、ファイルが増えて120GBになったとします。するとその日のバックアップは120GBになります。

復元する際にタイミングを指定して1回でリカバリできるのはメリットのような気もしますが、バックアップに要する容量が莫大となり、且つバックアップ時間もリカバリ時間も膨大となるため、堅実な様に見えて、ほとんど使われていないのが現状です。

個人利用しているPCのバックアップを、1週間ないしは1か月の頻度で、3,4世代くらい保管しておく位なら良いかも知れませんが、少なくとも企業等の大量のデータ保管に向かないことは安易に想像できるかと思います。

差分バックアップ

差分バックアップ(Differential Backup)とはその名の通り、差分をバックアップすることですが、何の差分かと言いますと初回のバックアップとの差分を保存するのが差分バックアップです。

初回のバックアップはフルバックアップを行いますが、2回目のバックアップは初回との差分をバックアップします。

初回バックアップ:100GB
2回目バックアップ時容量:120GB
2回目バックアップ対象:20GB

となります。3回目も同様です。3回目バックアップ時に150GBになっていれば、初回との差分の50GBをバックアップします。

そのためリカバリの際には初回のバックアップと復元したい日のバックアップの2つをつなぎ合わせてバックアップすれば良いので比較的早いバックアップが可能です。

ただし、後述する増分バックアップよりはバックアップ時間が長く、複数世代を残す場合はより大きい容量の保存スペースが必要となります。

増分バックアップ

増分バックアップは前回バックアップからの増分をバックアップします。こちらも初回に関してはフルバックアップを行います。

初回のシステム容量:100GB
2回目バックアップ時の容量:120GB
2回目バックアップ対象:20GB
3回目バックアップ時の容量:130GB
3回目バックアップ時対象:10GB

ということになります。

リカバリ時に複数のファイルをつなぎ合わせる必要があるので煩雑になりますが、1回あたりのバックアップ量が少ないためバックアップ時間が短いのと、複数世代を保管しても比較的容量を圧迫しないのがメリットとなります。

世代管理とは

世代管理のことを英語でRetention Policyと言いますが、どれくらいの期間のバックアップを取得するか設計して、取得、管理していくことです。

例えば、1日1回はバックアップしたく、30日は遡れるようにしておきたいという要件があった場合、30世代の保管といったような設計となります。

一方で、30日前まで遡りたいが、毎日である必要はなく2日に1回で良ければ、15世代保管していれば、2日x15世代で30日前まで遡れます。

実際にはシステムやデータがどの頻度で更新されるか、何日間まで遡れる必要があるか検討します。

バックアップおよびリカバリ設計(所要時間)

こちらも重要なので記載しておきます。実際にバックアップやリカバリの設計をする際に忘れてはならないのがその所要時間です。

例えば、バックアップ処理中はシステムに変更が発生してはいけない可能性がありますので、バックアップだけに数時間もかけてられません。

また、リカバリに関しても、障害発生時に1日でも早く復旧させたいのに、リカバリ時間だけで1週間も時間をかけていられません。

そのため、実際にバックアップの設計をする際は、想定されるシステムやデータの容量、それを差分もしくは増分バックアップする時間、リカバリする時間、バックアップを保存しておく場所と保存可能量などを検討していく必要があります。

バックアップの保管場所

記事を書いていて思い出したことがあるのでオマケです。

以前とある部署でしっかりバックアップ設計をしていたのですが、保管場所だけ失敗してしまったと聞いたことがあります。障害発生時に理論上は8時間程度で復旧できる想定でしたが、クラウド上にバックアップデータを保存してしまい、クラウドからシステム(オンプレ)環境にダウンロードするだけで72時間かかる計算となってしまっていました。

クラウドからバックアップデータをダウンロードするという人が作業する手間は数十分と見込んでいたようですが、ダウンロードそのものにかかる時間が抜けてしまっていたようです。

めっさん
  • めっさん
  • 当サイトの管理人。ニューヨークの大学を飛び級で卒業。その後日系企業でグローバル案件に携わる。大小様々な企業を転々としながら、マレーシアやアメリカへの赴任経験を持つ。バイリンガルITエンジニアとしていかに楽に稼ぐか日々考えている。年齢は秘密だけど定年も間近かな。

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です