ざさいたま
アバウト ギャラリー コンピュータ その他 リンク集

安全なデータの保護手段を考える

はじめに

 データの安全な保護手段はどのようなものがあるだろうか。安全な手段とはいっても、データの存在そのものの場合と、データの機密性についての場合がある。ここではデータの機密性、秘匿性ではなくあくまでデータの存在そのものについて限定して考えてみたい。データを消滅させないように如何に対策を講じるかという話である。
 データを保存する装置なりメディアなりは、その性質上故障という問題から逃れることはできない。故障が起こった場合のために、データが納められている装置なりメディアなりを複製し、多重化する。基本的な考え方はデータに対して物理的な冗長性を持たせてデータを守ることになる。冗長性を持たせるために、世間で行われている一般的な方法について考察してみたい。

単純バックアップ

 データが保存されているメディアあるいは装置を単純に複製し多重化することである。この方法は手間が掛かるが、単純にして強力な方法である。メディアなり装置は互いに独立した関係にあるので、一つが機能不全に陥ったとしても、それとは関係無しにデータを読み出すことができる。
 私は手間が掛かるといった。特に大容量のデータを複製するには、転送に時間がかかる。そのためこの単純バックアップは定期的に行うことにしても、手間が掛かることになるため長続きしない。

差分転送、自動化

 この問題は比較的簡単に解決できる。データの多くは既に蓄積されたものであり、新しいデータはごくわずかである。このごくわずかな追加・変更部分を転送すれば良いのである。最近ではこの手の用途に最適なソフトウェアがある。自動的に行うようシステムにスケジューリングをすれば手間が掛かることではない。手間がかかったとしても、システムの構築だけで済む1)

RAID

 最近では複数のハードディスクを組み合わせて、データの冗長性を持たせるRAID2)と呼ばれるシステムが普及してきた。複数のハードディスクにデータを分散して書き込み、万が一ハードディスクの一部に障害が発生したとしても、パリティと呼ばれる冗長データから、データを復元することができシステムである。単純バックアップと比較するとデータは自動的に冗長性を持つことになり、複数のハードディスクがまとまった巨大なボリユームとして扱え、かつ障害が発生してもシステムを停止することなく運用できるなど利便性が高いシステムである。

便利さと裏腹に

 このシステムは利便性が高いため、問題があることは既に指摘してきた3)。システムが多少故障しても問題なく動作してしまい、許容を超える障害が発生した場合はデータを救い出すことがきわめて困難になってしまう。RAIDをシステムを利用するさいには以下のことに注意したい。
  • システムを導入する段階で、障害発生時の為の予備ハードディスクを購入すること。故障が発生する時には、目的のハードディスクは入手困難になっているためである。
  • 構成するアレイはなるべくハードディスクの数を少なくすること。構成アレイのハードディスク数が多いことは、確率的な観点から考えても、障害の確率が増加することを意味する。
  • 導入する前にリビルトの手順など操作について熟知していること。障害が発生した場合は焦っている。間違った手順で操作してまうとデータは消えてしまう。
  • ハードディスクの障害は保護してくれるが、RAIDのコントローラーの障害は保護されない。コントローラーの障害のリスクを持ち込むことになるのを忘れないこと。
 最近は低価格化がすすみ、導入が容易になったRAIDであるが人的な負担は依然として高いのである。

思わぬ陥穽

 ここで大きな落とし穴がある。冗長性を持たせても、データの物理的な位置が同じであれば、火事あるいは激甚災害が発生した場合に、データを失うこともある。火事でシステムが燃えたり、災害で装置が水没あるいは破損した場合はデータはまず復元できない。
 データの物理的な位置についても気を配る必要がある。したがって、複製したデータは遠隔地にあるほうが好ましい。複製のたびにデータが入ったメディアなり装置を遠隔地に輸送していたのでは、大きなコストがあり現実的ではない。しかし近年では、通信環境の整備がめざましいため、そのようなことも行える。地理的なリスクは是非頭に入れていただきたい。

インターネット

 遠隔地にデータを転送することが困難なユーザーもいるかと思う。通信手段があってもデータを保管するための専用のリモートサーバが確保出来ない場合である。専用のコンピュータをデータセンターに設置することは普通は難しい。そのようなユーザは、インターネッ上のデータ保管サービスを利用するのもいい。最近では無料で比較的大きいデータを預かってくれるサービスもある4)

独立した多重化を心がける

 データを守るためには、いずれの手段を用いても、それぞれのメディアなり装置に記録されているデータが、独立して読み出せることが求められる。また、メディアなり装置だけでなく、地理的な点も考慮する必要がある。自動的にデータの差分を遠隔地に送信し、データが複製されるシステムで、かつ複製されたデータは被転送地で独立して読み出せるものが、理想的なシステムである。
 システム管理者に限らず、一般のユーザも、データの保護について一考してみるとよいだろう。
(小宮和寛)

注:
 1)UNIX LikeなOSではrsyncと呼ばれるソフトウェアを利用して、スケジューリングさせることが一般的である。
 2)ここでとりあげるRAIDレベルは5や6等のパリティーによる冗長性がある方式である。
 3)拙稿「RAIDの安全性と復旧」2011年を参照されたい。
 4)秘匿性が高いデータについては、データの保全上利用しないことが好ましい。専用のサーバを運用すべきである。
  戻る
saitama web-framework (c) 2007-2012 thesaitama. All Rights Reserved.