データベース・アプライアンスの先駆者
今回発表となった製品の正式名称はIBM PureData System for Analytics。長いので今回はNetezzaと旧製品名で表記するのをお許しいただきたい。とてもキャラの際立つ製品だ。
まずは位置づけを確認しよう。IBMは2012年4月に新たな製品カテゴリとしてPureSytemsファミリーを発表した。おおざっぱに言えばハードウェアとソフトウェアを最適化し、専門家の知見を実装した製品群だ。その中には基盤向けのPureFlex、アプリケーションプラットフォーム向けのPureApplicationがあり、2012年10月にデータプラットフォーム向けのPureDataが追加された。さらにこのPureDataはワークロードに応じて3つに分類されている。
PureData System for Transactions
更新処理向け。おおざっぱに言えば、PureFlexにDB2 pureScaleの技術を組み合わせたもの。
PureData Systems for Analytics
データ分析向け。IBMに買収される前は「Netezza」という名前だった。データウェアハウス・アプライアンスの始祖とも言える製品。
PureData Systems for Operational Analytics
業務データ分析向け。IBM Smart Analytics Systemをベースにしている。
もう少しNetezzaを知るために、過去をさかのぼってみよう。Netezzaは2000年に創業し、当初からデータウェアハウス専用機の開発に専念していた会社である。一般的にオープンシステムで構築したシステムでは導入、構築、運用に多大なコストがかかることが課題となっていたため、創業者らは手軽に安く、そして早い、分析に特化した製品を作ることを目指した。そしてデータウェアハウスの専用機となるものをゼロから作り上げ、2003年に初製品をリリース。これは世界初のデータウェアハウス・アプライアンス製品であり、「データウェアハウス・アプライアンス」という呼称もNetezzaから始まった。
初期製品から基本的な特徴は変わらない。データベース(PostgreSQLをベースにしているそうだが全く独自のものへと作り変えた)、サーバー、ストレージで構成されている。見た目は「背の高い冷蔵庫」のような大きな箱だ。技術的にはデータ分析に特化した非対称型超並列処理(AMPP)、およびFPGA(Field-Programmable Gate Array)で高速化を実現している。
Netezzaはデータウェアハウス・アプライアンスという独自の境地を切り開いたとも言える。先駆者であり、独自性もあり、データウェアハウス・アプライアンスでは「無敵」だと滝沢氏は胸を張る。
当初はソフトウェアだけではなくハードウェアも独自だったそうだが、2009年に発表したNetezza TwinFinからはIBMのハードウェアを採用している。Netezza TwinFin発表の少し後にIBMがNetezza買収を発表し、NetezzaはIBM製品のラインナップに加わり、2012年のPureData発表とともに名前を「PureData Systems for Analytics」と改めた。そして2013年2月にNetezzaの新モデルとなるN2001を発表したところ。
余談ではあるが、2008年にオラクルが初めてExadataを発表したとき、オラクルCEOのラリー・エリソン氏が何度かNetezzaを口にしたそうだ。Netezzaがラリー・エリソンの闘争心に火を付け、Exadataが生まれたとしたらちょっと面白い。