そのディスクはいつか必ず壊れる
大切なものは誰でも信頼が置けるところにしまうものである。それは戸棚である場合もあれば、それは金庫である場合もある。コンピューターで利用するデータはディスク等に収められているのだが、残念なことにディスク装置は100年利用できるものではない。ディスクは磁性体が付いた円盤をモーターで回転させながら利用するストレージ媒体であるため、必ずいつか壊れてしまう。一般には壊れる前に新しいディスクに交換し、データを新しいディスクに引っ越すのであるが、不幸なことに予測できない不慮の事故のためにディスク装置が壊れてしまう可能性がある。ディスクが壊れるとデータはもう2度と読むことはできなくなるので一大事だ。従ってデータのコピーを別の場所の保管して置くことは非常に大切なことになる(図9-1)。
混同されがちなアーカイブとバックアップ
アーカイブとバックアップは本質的に全く異なる行為なのだが、この両者を混同して話をされる方が非常に多い。バックアップとは本体としてのデータがどこかに存在し、本体に障害が発生した場合に備えて取得するコピーのことである。これに対してアーカイブとはデータ本体そのものが移動することを指す(図9-2)。コピーと移動では大きな違いがある。しかしここまでの説明を理解してくださる方は沢山おられるのであるが、現実の運用に当てはめると、意外に混同してしまう方が大勢いる。
例えばディスクに1つのファイルがあったとし、このファイルをテープを使ってバックアップしていたとしよう。利用するテープは3本。つまり3世代でバックアップしているという運用形態だ。ディスクにファイル本体がある状態では悩むようなことは無いのだが、このファイルがディスク上から消されてしまった場合を考えると混同が起きやすい。データ本体が消えた時点でテープ上にバックアップされたデータはアーカイブされたデータであると勘違いされることが多いのだ。
しかしよくよく考えればわかることなのだがこれはあくまでバックアップであり、本体が消えたのであればその時点で消えても構わないものだ。もう本体のファイルは存在しないのだからこれを復活させる理由も無い。もちろん本体のファイルが誤った消去操作で消された可能性もあるため、一定期間保存しておくことは有効な手法であるのだが、そうであっても、通常最新世代以外はもう用済みであると考えてよい。
しかしアーカイブ目的でテープ上にデータを保管したいと考えている場合、ディスクから無くなってから何日間保管するという運用は、余り良い運用であるとは言い難い。アーカイブではあくまでデータ本体の保存日数で管理されるべきものであり、それがたまたまディスクからテープへ写ったとみなすべきだからだ。
仮にディスク上のファイルが消えてしまった時点で、このバックアップが質的にアーカイブへと変化したと捉える運用をしているとすると、テープ上に保管された最新のバックアップは本体であるということになり、これが事故で消えてしまったようなケースでは、本体に対するバックアップは存在しないということになる。
1世代前のテープがあるのだから、それをバックアップと見なせば良いではないかと考える方もおられるかもしれないが、それはあくまで1世代前の内容であり、消えてしまった最新バックアップ(つまりこの時点の本体)の内容ではない。アーカイブの場合、ファイルがテープへ移動したからといって、そのデータに対するバックアップが不要になるわけでは無いはずだから、アーカイブを行ないたいと思うのであれば、バックアップとは別の形でデータをテープへ保管する必要がある。つまりバックアップで保管する操作とデータ本体の移動であるアーカイブ操作はきっちりと分けて別の観点で運用しなければならないのだ。
ここでご紹介したケースは、ホスト系システムを長年運用していた方々に良く見られがちな誤解だ。昔はディスクの値段が高かったため、ディスク上にデータを置く行為自体が一時的なものであり、本体データは全てテープに保管されていた時代の名残でそうなってしまっているケースが多い。
そんな古い話が21世紀の今に至るまで残っているなんて稀なケースだとお考えの方もいるであろうが、驚くことに口伝で伝承された運用は、意外と根強く残っているのだ。大きな企業ではこのような運用形態を若い時分に叩き込まれた方が今では管理職として全体を統率する仕事に着かれていることが多い。これが正しいと信じて運用している方々は、アーカイブ目的でデータをテープに保管する操作をバックアップと呼んでいたりするので、相手がどんな意図でバックアップという言葉を使っているのかを見極めていないと、話が全然かみ合わなくなるので注意が必要だ。