メールアドレス(半角):

バックナンバーはこちら

Solution

製品紹介


清田陽司について


つづきはこちら infomation一覧へもどる

クラウド時代に注目されているデータベース

リッテルの藤井です。

今日はクラウド時代に注目されているデータベースの話をします。

全世界の電子データベースの量は、急激な勢いで増えています。
その増加速度は年に60%ともいわれており、米調査会社IDCによれば、
全世界で生成あるいは複製されたデジタル情報の総量は、2011年には
1.8ゼタバイトにも達するといわれています。
http://www.emc.com/collateral/analyst-reports/diverse-exploding-digital-universe.pdf

1.8ゼタバイトといってもピンとこないかと思いますが、ゼタというのは、
ギガよりケタが12個も多いです。単位を比較すると、以下のようになります。

ギガバイト < テラバイト < ペタバイト < エクサバイト < ゼタバイト

ちなみに、1.8ゼタバイトを全世界の人口である約69億人でわると、
ひとりあたり260ギガバイトくらいです。
発展途上国のパソコンなんてさわったこともない人々や、
さっき生まれたばかりの赤ちゃんもみんな含めて、
1人あたり260ギガバイトくらいの量です。とてつもない量ですね

さて、このように膨らんだデータベースですが、
クラウド時代にはどのようにマイニングすればよいのでしょうか。

クラウド時代のデータマイニングひとつのポイントは、
多くのサーバに分散させてデータ処理を行わせる、というものです。
安価なサーバを大量に買って分散処理を行えば、
量の膨らんだデータベースにも対応できます。

すぐに考えられるのは、OracleやDB2といったリレーショナルデータベース
マネージメントシステム(RDBMS)を、
より低層の分散システム(クラスタ)上で用いるというものです。

RDBMSを複数のマシンで並列動作させる技術も発達していて、
商用データウェアハウス製品として実用化されています。

こうした分散RDBに対して、分散KVSというものも最近注目されるようになりました。
たとえば弊社でも扱っているHadoopを用いる際には、
データベースとしてKVSであるHBaseを用います。


では、分散RDBと分散KVSはどのように違うのでしょうか。
次回に続きます。

ご意見・ご感想などぜひ送ってくださいね
↓↓↓
mminfo@littel.co.jp

ページTOPへ

つづきはこちら infomation一覧へもどる