垂直統合型システムPureData Systemのラインアップを拡充
PureData Systemには、高速データ入出力処理向け(トランザクション処理向け)の「IBM PureData System for Transaction」、大容量データの高速分析処理向け(DWH向け)の「IBM PureData System for Analytics」、業務データの即時的な分析処理向け(オペレーショナルデータ分析向け)の「IBM PureData System for Operational Analytics」がある。
発表に際し、ソフトウェア事業担当専務取締役執行役員のヴィヴェック・マハジャン氏は「IBMのビッグデータプラットフォームはすでに国内で130社以上の導入実績がある。どのベンダーよりも多くの実績があると自負している。今回のラインアップの追加で、より簡単により迅速にビッグデータを活用できるようにする」と新製品投入の意図を紹介した。
ソフトウェア事業インフォメーション・マネジメント事業部事業部長の望月敬介氏は、新製品が求められる背景として、「2013年に入りビッグデータに関するソリューション導入が本格化し、ビッグデータ分析に対するニーズも多様化している。導入が容易で構築や運用の負荷が少ないアプライアンス製品を求める声を多くいただいていた」と説明した。
特にHadoopシステムの構築は思ったよりも高負荷で導入に時間がかかることから、アプライアンスに対するニーズは強かったという。たとえば、Hadoopを導入した企業は、サイジングや機器選定、それらをどう組み合わせればよいかといったことで苦労しているという。また、問題発生時には自力で解決しなければならないことも課題だった。
「アプライアンスにすることで、ベストプラクティスに基づいた構成を採用でき、問題発生時には、IBMの一貫したサポートを受けることができる。ビッグデータの分析に対するユーザーの多様なニーズ、クイックな始動に対応する」(望月氏)
PureData System for Hadoopは、IBMのHadoop拡張版であるIBM InfoSphere BigInsightsと事前定義済みのハードウェアをセットにし、Hadoopの初期導入や構成やサポートなどを行いやすくしたHadoopアプライアンス。合計18台のデータノード、216個のCPU、40ギガビットイーサネットなどで構成される。データノードの内蔵ディスクはHDFSでフォーマットされ、データを圧縮して格納することで、約1PBの容量まで対応できる。数日で初期設定を完了し、Hadoop環境での分析が可能になるという。
特徴的な機能としては、Hadoop上でANSI準拠のSQLを利用できるようにするBigSQL、Hadoopのデータを手軽に分析できるようにするスプレッドシート機能のBigSheets、ハードウェアをビジュアル化してディスクやコンポーネントの障害などを統合管理できるWeb管理コンソール機能などがある。いずれも、IBM BigInsightsで提供される機能だ。
一方、エントリー向けのPureData System for Analyticsは、ハイパフォーマンス向けのPureData System for Analyticsと同様、FPGA(Field-Programmable Gate Array)による並列処理を特徴として持たせながら、分散処理するためのブレード数を2つにとどめた製品。CPUは32コアで、ディスク搭載本数は48、総ディスク容量は最大8TB(圧縮後32TB)となる。FPGAによる並列処理は、ディスクに格納された圧縮データをFPGAを使って解凍し、最終的なアウトプットに必要なデータだけをメモリに展開してCPUに処理させることで、高速処理を実現する技術だ。
2つの新製品間でのデータ連携も可能になっている。Optim EasyArchiveと呼ばれるPureData System for Hadoopに備わるGUIのデータインポート/エクスポート機能を使って、PureData System for Analyticsからデータをインポート/エクスポートできる。PureData System for Hadoopにインポートしたデータに対し、PureData System for AnalyticsからSQLを発行するなど、両方のデータへのアクセスができる。コマンドでの実行も可能だ。