back to contents
特集ハイパーライブラリー
ハイパーライブラリー・キーワード



超並列データベース・サーバー

 データベース処理を司るシステムをデータベース・サーバーと呼ぶが,その対象とするデータ量が莫大であり,単一プロセッサでは充分な性能が期待できない場合,多数のプロセッサを用いデータベース処理を並列に実行する超並列データベース・サーバーが用いられる.

 近年,情報の電子化が大きく進み,データベース容量が急増していることから商用化が進められている.例えばコンビニエンス・ストアのPOS端末で得られる電子的データには「どの程度の年齢の男性あるいは女性が何時にどんな商品をいくらで購入したか」という情報が含まれている.全国に散在する各店舗からコンピュータを用いデータを収集,データウェアハウスに投入した後,この莫大なデータを解析することによりユーザーの新しい購買傾向をいち早く検出し,新しいビジネス指針を得ることができる.このようなデータマイニングと呼ばれるデータベースを基盤としたツールはビジネス上不可欠のものとなりつつある.

 実際,米国では数テラバイト(テラバイト=1012バイト)の容量を有する巨大データベースがオンラインで利用されているが,そこでは300台以上のプロセッサを有する超並列サーバーが利用されている.

 図1に超並列データベース・サーバーの概念図を示す.各プロセッサはデータベースの一部を分担することで,全体としてデータベース検索処理を並列に実行する.

 一般に超並列コンピュータは逐次型コンピュータ(単一プロセッサ・マシン)に比べてプログラムを作成するのが大変難しいため,敬遠されがちであるが,データベース・サーバーではユーザーはこの問題に悩まされることはない.これはデータベース・アクセスには一般にSQLと呼ばれる非手続型言語が利用されることによる.すなわち,ユーザーは並列性を意識する必要はなく,並列化はすべてシステムが行なう.データベース並列化コンパイラ技術は近年大きく進歩しており,超並列データベース・サーバーを支える重要な要素技術となっている.

 マルチメディア時代に入り,文字情報だけでなく種々のメディア情報の操作に対する挑戦も始まっている.指紋照合など画像データのマッチングを超並列データベース上で実装することにより大幅な性能向上が期待できる.ユーザーの定義した独自のマッチング・プログラムを,メソッドとしてデータベースへの登録を可能とするオブジェクト指向データベース化が進められている.

 従来,データベースはメインフレームでしか実現できないものと考えられてきたが,マイクロプロセッサの一層の低価格化と並列データベース処理技術の進歩により,超並列データベース・サーバーは広く社会に受け入れられつつある.

(きつれがわ まさる・データベース工学)