SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

DB Press(AD)

Alibaba CloudはPostgreSQLをこう使う!―PGConf.ASIA 2016

PostgreSQLのクエリーの中でGPUの強力な処理能力を活用するには

 「PL/CUDA – HPC級の計算能力をIn-database統計解析へ」と題した講演を行ったのは、NECの海外浩平氏だ。「少しとがった部分の話になります」と言う。GPUを用いたPostgreSQLの高速化モジュールであるPG-Stormは、データベースにクエリーが来るとオプティマイザーが判断しGPUで処理したほうが速いものはGPUで処理するもの。JOIN、GROUP BY、Projectionに対応し、アプリケーションからはクエリーの変更が必要ないのが特長だ。

NEC 海外浩平氏
NEC 海外浩平氏

 現状、GPUの処理は強力で、NVIDIAのハイエンドのTesla P100ではコア数が3,584で並列度がかなり高い。「ただし、それを意図したコードを書く必要があります」と海外氏。PG-StormならSQL文のWhere句で計算式をCUDAプログラムに変換し、それをランタイムコンパイルしてGPUで実行できる。9.5のパラレルクエリーが入っていないものとの比較では、CPUではだんだん遅くなる処理がGPUを使った場合は処理時間がまったく増えない結果が示された。

 とはいえ、この方法は計算集約的で統計計算の専用の仕組みよりは遅い。そこでPL/CUDAで、GPUプログラムのためのCUDAコードをクエリーの中で書くようにした。その実証のために、創薬ベンチャーが化合物の類似度の計算をする実験も行った。化合物群が1,000個くらいある中から近いものを探す。この類似度計算の処理をCUDAで書きPL/CUDA関数で計算させ、結果はPostgreSQLのレコードに入る。あとは他のテーブルとのJOINなど可能だ。CPUで記述した場合は、3,000秒ぐらいかかったものが19秒になった。

 50分かかると夜間バッチにするが、10数秒になればトライアンドエラーの作業に変えられる。この違いは大きい。PL/CUDAを使えば、マニュアルでGPUの性能を引き出すのに使え、SQLの中で計算させ結果を柔軟に使えるようにできるということだ。

Pgpool-IIはPostgreSQLに寄り添いながら進化し続ける

 「Pgpool-IIの過去、現在、未来」というタイトルで講演を行ったのは、SRA OSS, Inc. 日本支社の石井達夫氏と長田悠吾氏だ。Pgpool-IIは多彩な機能もつPostgreSQL用のクラスタ管理ツール。石井氏よりその歴史が語られた。

SRA OSS, Inc. 日本支社 石井達夫氏
SRA OSS, Inc. 日本支社 石井達夫氏

 その誕生は2003年、PHPでコネクションプールが使えないことを不満に思った石井氏がPostgreSQL用のコネクションプールサーバ「pgpool」を作ったのが始まりだった。その翌年にはレプリケーション機能が実装された。PostgreSQLにまだストリーミングレプリケーションがなかった時代の話だ。その後も様々な機能が加わり今のPgpool-IIがある。

 開発体制も個人プロジェクトからコミュニティによるチーム作業へと変わっていった。現在ではパキスタンから開発に参加しているメンバーもいる。

SRA OSS, Inc. 日本支社 長田悠吾氏
SRA OSS, Inc. 日本支社 長田悠吾氏

 多機能なPgpool-IIだが、現在ではストリーミングレプリケーションの管理ツールとして使われるケースが多い。負荷分散や自動フェイルオーバなどの基本機能に加え、Pgpool-II自体の可用性を高めるWatchdogやクエリキャッシュといった付加機能も備える。

 「PostgreSQLのレプリケーション技術の進化に合わせてPgpool-IIも進化していきます」と石井氏。今後は同期レプリケーション、カスケードレプリケーション、そして来たるマルチマスタレプリケーションに対応していくという。

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
DB Press連載記事一覧

もっと読む

この記事の著者

DB Online編集部(ディービーオンライン ヘンシュウブ)

DB Online編集部翔泳社 EnterpriseZine(EZ)が提供するデータベース/データテクノロジー専門メディア「DB Online」編集部です。皆様からの情報お待ちしています。

Twitter : https://twitter.com/db_online
Facebook : http://www.facebook.com/dbonline.shoeisha

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/8823 2017/01/11 06:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング