EnterpriseZine(エンタープライズジン)

EnterpriseZine(エンタープライズジン)

テーマ別に探す

002 PostgreSQL9.3 開発と運用を支える新機能

edited by DB Online   2014/02/28 00:00

 前回は、PostgreSQL 最新バージョン 9.3の新機能の中からエンタープライズ領域の注目すべき機能について紹介しました。今回も引き続き、開発・運用面において、注目すべき機能をさらに詳しくお届けします。

PostgreSQLデータベース間のスムーズなデータ連携を実現するpostgres_fdw

 開発面で注目すべき機能としてpostgres_fdwをご紹介します。

 PostgreSQL 下位バージョンではデータベース間のデータ連携機能としてdblinkモジュールが提供されていましたが、postgres_fdwはその後継機能にあたり、PostgreSQL 9.3ではcontrib配下に含まれる形式で提供されています。

 postgres_fdwでリモートデータを連携するステップは以下の通りです。1度設定してしまえば、その後はローカル表と同じようにリモート表にアクセスできます。

  1.CREATE EXTENSIONコマンドでpostgres_fdwモジュールを読み込み
  2.CREATE SERVERコマンドで接続先のデータベース情報を定義
  3.CREATE USER MAPPINGコマンドで接続先のユーザ情報を定義
  4.CREATE FOREIGN TABLEコマンドでリモート表をローカル側に定義

 ※手順2および3がOracle DatabaseのCREATE DATABASE LINKコマンドに相当します。

図7:postgres_fdwの利用
図7:postgres_fdwの利用

 postgres_fdwはdblinkと比べてどのような特徴をもっているのでしょうか。ここでは主な特徴を2つご紹介します。

1.SQLにローカル表と同じ形式でリモート表を記述できる

 例えば、リモートにあるsup_log表に対してpostgres_fdwとdblinkそれぞれを利用してSELECT文を実行する例を見てみましょう。

図8:postgres_fdwとdblinkの利用
図8:postgres_fdwとdblinkの利用

 dblinkを利用した場合、図8のようにSELECT文の中でdblink関数を呼び出す形で接続先のデータベース名などの情報を付加してリモートのsup_log表にアクセスする必要があります。

 一方、postgres_fdwを利用した場合、SQLにローカル表と同じ形式でリモート表を記述します。postgres_fdwでは特殊な構文を習得する必要がないため、アプリケーション開発の難易度を低減することができます。

2.結合処理の際、データ転送量を抑制できる

 これは、特にローカル表とリモート表を結合し、さらにローカル表の特定データを元にリモート表から行データを絞り込む場合に効果を発揮します。

 dblinkでは、図9のようにリモートのsup_log表のデータをすべてローカルに転送してから結合処理やWHERE句による絞り込みを行う必要があり、表によっては大量のデータを転送することになります。

図9:dblinkによるリモート表からのデータ取得
図9:dblinkによるリモート表からのデータ取得

 一方、postgres_fdwはローカルにある表の行データを条件にリモートにある表データを絞り込むことができます。図10のようにローカルにあるcust表の特定データを元にリモートにあるsup_log表の必要なデータを事前に絞り込みます。

図10:postgres_fdwによるリモート表からのデータ取得
図10:postgres_fdwによるリモート表からのデータ取得

 postgres_fdwとdblinkそれぞれの実行計画を見てみましょう。

 図11のようにdblinkではFunction Scan on dblinkという計画タイプが選択され、リモートにあるsup_log表の50万件すべてのデータを読み込んでいることが分かります。

 一方、postgres_fdwではForeign Scanという計画タイプが選択され、sup_log表にアクセスしていますが実際に読み込んだ行数はわずか6件です。これにより所要時間に約4倍もの差が出ていることが分かります。このように、postgres_fdwを利用することで処理によってはリモートから転送するデータを必要最小限に抑えることができるため、ネットワークへの影響を軽減し、さらに処理速度を向上させることができます。

図11:postgres_fdwとdblinkにおける実行計画の違い
図11:postgres_fdwとdblinkにおける実行計画の違い

 その他の特徴として、postgres_fdwではリモート表に対するANALYZE処理をローカル側で明示的に実行すると、その統計情報をローカル側に保有できます。そのため、ローカル側で行われる結合や集計処理の実行計画をローカルのプランナが最適化できるのも利点の1つです。

 以上のように、Materialized Viewとpostgres_fdwを組み合わせることで今まで以上にリモートからのデータ連携がスムーズに行えることがわかります。

※この続きは、会員の方のみお読みいただけます(登録無料)。


※この続きは、会員の方のみお読みいただけます(登録無料)。


著者プロフィール

  • 高瀬 洋子(タカセ ヨウコ)

     株式会社アシスト データベース技術本部  アシスト入社後、Oracle Databaseのサポート業務を経て、2009年よりPostgreSQL、EDB Postgresのサービス立ち上げに参画。2017年4月にイギリスから日本へ拠点を戻し、海外イベントで得た情報などを活かしてEDB Postgresの啓蒙活動を担当。

バックナンバー

連載:PostgreSQL9.3 新機能を検証してみた
All contents copyright © 2007-2022 Shoeisha Co., Ltd. All rights reserved. ver.1.5