「ClassCat Analytics Stack for Spark」は、ビッグデータ解析で注目されるApache Sparkを軸にHadoopエコシステムを配備して構築されたオープンソースのソフトウェア・スタックで、IBM SoftLayerベアメタル(物理サーバ)上で提供される。
スケーラブルな拡張にも対応しているため、ベアメタル1台から始めることも可能だという。データ解析言語Rに対応している点も特徴で、データサイエンティストの利用に最適なデータ解析基盤だとしている。
「ClassCat Analytics Stack for Spark」は、データ解析エンジンとしてApache Sparkの最新ステーブル版(1.4.1)を使用している。Apache Sparkは、Apacheトッププロジェクトとして開発が進められているクラスタ指向の分散処理フレームワークで、次世代ビッグデータ解析プラットフォームとして注目されている。
Apache Sparkの設計主眼は、高速性と汎用性で、Hadoop MapReduceより高速とされ、インタラクティブなシェルをはじめとする柔軟な使い方が可能だ。また、SQL・ストリーミング・機械学習に対応した有用なライブラリも豊富に提供されているという。
この記事は参考になりましたか?
- 関連リンク
- この記事の著者
-
EnterpriseZine編集部(エンタープライズジン ヘンシュウブ)
「EnterpriseZine」(エンタープライズジン)は、翔泳社が運営する企業のIT活用とビジネス成長を支援するITリーダー向け専門メディアです。データテクノロジー/情報セキュリティの最新動向を中心に、企業ITに関する多様な情報をお届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア