RAIDという考え方の出現
「RAID」と書いて「レイド」と読む。これは「Redundant Arrays of Independent Disks」の略である。元々はカリフォルニア州立大学バークレー校のデビッド・パターソンらによる論文である「A Case for Redundant Arrays of Inexpensive Disks (RAID)」に於いて1988年に提唱されたディスクの利用形態である。
論文のタイトルにはハッキリと「Inexpensive Disks(安いディスク)」と明記されているのであるが、一般にメーカーが製品を提供する場合、安いディスクは壊れやすいというイメージが付いて回ることと、実際に製品化した際に、必ずしも安いディスクだけを使うわけではないという理由から、現在ではRAIDと表現した場合は「Independent Disks(独立したディスク)」と表記する場合が多い。これはどっちが正しいと主張しあう内容ではないため、今では両方とも正しいという見解が一般的である。
RAIDが考え出された背景
RAIDが論文で提唱された1988年、企業向けディスク装置の主役はIBMの3380Kモデルが代表的なディスク装置であった。容量は家庭用大型冷蔵庫1台半~2台分の大きさで、容量は約7.5GBだった。14インチのディスク円盤が連なった「HDA(Head Disk Assembly)」と呼ばれるディスク・スピンドルを2個収容し、1つのHDAにデータ・アクセス用のアームが2本装備されていた。つまり1つのHDAを2個のHDAとして利用するような設計だった。今のHDDの感覚で言うと4つの大きなHDDが入っているような感じの製品だ。
その頃、各メーカーは容量が大きく、信頼性が求められるディスク装置は、全てその装置のために技術を開発し最高の技術を注ぎ込んだ。円盤が14インチと大きかったのは、より大容量を記録できるためだった。円盤が大きいので当然ながら図体の大きい製品となってしまっており、価格も高いものであった。この頃の小型のHDDは5.25インチのものが主流であり、その容量も数MB~数十MBのものが一般的であった。用途もパソコンや小型コンピュータ向けであり、円盤が小さい分、データ容量があまり大きくなく、信頼性もスピードも遅いものだった。ただ、小さくて安いというのは非常に大きな魅力であり、この技術を何とかして大きくて高い製品の代替にできないかと考えられたのである。RAIDの3番目の文字であるIが値段的に安いという意味で用いられた要素はここにある。
可用性という名の大きな壁
複数の小さくて安いHDDをたくさん並べれば、大きいディスクと同容量を実現することは可能だということはある程度容易に想像が付いたが、当時はマイクロプロセッサーの能力向上がようやく花を咲かせようとしていたばかりの黎明期であり、実際に作ろうとする場合、それほど簡単なものではなかった。とは言え、頑張ればできることは誰もが薄々は気づいていた。
しかしながらここには大きな別の課題が存在していた。可用性の課題である。可用性は高いほど良いに決まっている。しかし安くて小さいHDDを仮に10個並べて大きなディスク・イメージを作った場合、HDDのMTBF(Mean Time Between Failure)は10倍悪くなってしまう。MTBFとはある機器やシステムが故障するまでの平均時間のことだ。10個のHDDで1個の大きなディスク・イメージを作る場合、どこか1箇所(1個のHDD)が欠けても全体としてのデータの整合性が保てない。
例としてMTBFが10万時間のHDDが存在したとしよう。10万時間は年に直すと約11年半くらいなので、11年に1回くらいは平均で壊れるでしょうという意味だと理解すればよい。まあまあの数字だなと思えるのだがこれを10個並べて考えるとそうはいかなくなる。1個の大きなディスク・イメージを10個のHDDで構成しているのだから、10個のHDDは1つ壊れてもダメということになる。この場合のMTBFの計算は以下のようにMTBFを個数で割った値になる。
10万時間(個)÷10個=1万時間(10個)≒1.1年
MTBFがたった1年ちょっとではかなり不安である。更にこれが100個であった場合を想定してみよう。すると以下に示すようにMTBFはなんと1ヶ月ちょっととなる。これは1ヶ月ちょっと経つと、ディスクが1つ平均してどれか壊れるようだということを意味している。
10万時間(個)÷100個=1千時間(10個)≒1.3月
ここに示した例を具体的なストーリーに置き換えてみる事とする。大きなディスク・イメージを1個作るのに10個のHDDを利用し、全部で10個の大きなディスク・イメージを利用するシステムで使うことを想定する。つまり100個のHDDを利用すると1ヶ月に1回はHDDのどれかが壊れるので、バックアップからリストアーしなくてはいけないという意味になる。これでは実用上全然使えないということになり、このアイディアもこれでお仕舞いという話になりそうになったところへ登場するのが今回の主役であるRAIDなのだ。










