infomation一覧へもどる
クラウド時代に注目されているデータベース
リッテルの藤井です。
今日はクラウド時代に注目されているデータベースの話をします。
全世界の電子データベースの量は、急激な勢いで増えています。
その増加速度は年に60%ともいわれており、米調査会社IDCによれば、
全世界で生成あるいは複製されたデジタル情報の総量は、2011年には
1.8ゼタバイトにも達するといわれています。
(http://www.emc.com/collateral/analyst-reports/diverse-exploding-digital-universe.pdf)
1.8ゼタバイトといってもピンとこないかと思いますが、ゼタというのは、
ギガよりケタが12個も多いです。単位を比較すると、以下のようになります。
ギガバイト < テラバイト < ペタバイト < エクサバイト < ゼタバイト
ちなみに、1.8ゼタバイトを全世界の人口である約69億人でわると、
ひとりあたり260ギガバイトくらいです。
発展途上国のパソコンなんてさわったこともない人々や、
さっき生まれたばかりの赤ちゃんもみんな含めて、
1人あたり260ギガバイトくらいの量です。とてつもない量ですね
さて、このように膨らんだデータベースですが、
クラウド時代にはどのようにマイニングすればよいのでしょうか。
クラウド時代のデータマイニングひとつのポイントは、
多くのサーバに分散させてデータ処理を行わせる、というものです。
安価なサーバを大量に買って分散処理を行えば、
量の膨らんだデータベースにも対応できます。
すぐに考えられるのは、OracleやDB2といったリレーショナルデータベース
マネージメントシステム(RDBMS)を、
より低層の分散システム(クラスタ)上で用いるというものです。
RDBMSを複数のマシンで並列動作させる技術も発達していて、
商用データウェアハウス製品として実用化されています。
こうした分散RDBに対して、分散KVSというものも最近注目されるようになりました。
たとえば弊社でも扱っているHadoopを用いる際には、
データベースとしてKVSであるHBaseを用います。
では、分散RDBと分散KVSはどのように違うのでしょうか。
次回に続きます。
ご意見・ご感想などぜひ送ってくださいね
↓↓↓
mminfo@littel.co.jp
ページTOPへ
infomation一覧へもどる