エンタープライズ BI に求められる要件とは
Power BI はセルフサービス BI ツールとして注目されていますが、はじめてのPower BI でも記載したとおり、2015年7月のサービス開始から絶え間なく進化を続けており、エンタープライズ BI として利用するための各種機能も次々と実装してきました。
エンタープライズ BI に求められる要件として特に以下がよく挙げられます。
- 大容量のデータを高速に集計できること
- ユーザの権限に応じてレポートやデータに対する適切な認可を設定できること
- 監査レポートやモバイルBI展開時の適切なデータ保護等、各種セキュリティ機能があること
それではこれらの要件を Power BI でどう実現するか、見ていきましょう。
Power BI で大容量のデータを扱うには
本記事作成時点において、Power BI Service の1データセットで扱うことができるデータ容量は 1GB (圧縮後) までという制限があります。これは Power BI の無料版と Power BI Pro (有償ライセンス) で差異はありません。ただし、Power BI Pro の場合、Power BI Service にデータをインポートするのではなく、直接データソースにクエリを発行して、結果のみを表示することができるようになっており、大容量のデータを扱うことが出来るようになっています。Power BI の料金表の中で、「完全対話型のライブ データ ソースを使用する」と表現されている機能がこれにあたります。接続先のデータソースとしてサポートされているものとしては こちら に記載されており、マイクロソフトが提供する SQL Server や、Azure 上のデータサービスはもちろん、3rd Party 製の主要なデータベースにも対応しています。(プレビューと記載のあるものについては Power BI Service では未対応となります。)
また、SQL Server の分析用データベースである SQL Server Analysis Services (SSAS) に接続する場合は 「ライブ接続」と呼び、それ以外のデータソースについては 「DirectQuery」と呼びます。これは両者で内部的な挙動が異なっているためです。詳細はのちほどご説明します。
オンプレミスにあるデータ等、クラウドから直接つながらないデータを扱うには
前項では大容量のデータを扱う場合に、データソースに都度クエリを発行する方法がある、ということをご説明しました。このとき、マイクロソフトがクラウドサービスとして提供する Azure SQL Databaseや Azure SQL Data Warehouse(SQL DW) 等をデータソースとする場合は特に追加の構成は必要になりませんが、Power BI Service がホストされている Microsoft Azure の環境から直接つなげることができないデータソース、すなわちオンプレミスにあるデータや、他のクラウドサービス等に対してクエリを発行するにはどうすればよいのか、についてご紹介していきます。
マイクロソフトでは、皆様が普段ご利用の環境とPower BI Service とのブリッジとして機能する、オンプレミス データ ゲートウェイ (On-Premises Data Gateway) を提供しています。オンプレミス データ ゲートウェイはWindows マシン上で動作するサービスで、簡単にインストールが出来るようになっています。インストール要件や、構成方法については こちらのドキュメントを参照ください。ポイントはデータソースの受信ポートをインバウンド方向に開放せずとも、ゲートウェイからアウトバウンド方向の通信のみでセキュアに Power BI Service とデータのやりとりが出来る、という点です。また、オンプレミス データ ゲートウェイを構成した一台のサーバから複数のデータソースにアクセスすることが可能です。