セルフサービスBI、ビッグデータ、AI・・・BIを取り巻くいろいろなトレンドが発生し、BIへの関心はいまだ高いままですが、一方でBIへの理解が本当に深まっているとはいえません。新たに始まる本連載では、黎明期のBIから今のBIに至る道筋を振り返りつつ、最新の技術トレンドがBIを今後どのように変えていくのかを考察していきます。この連載を通じて、BIの本質を理解するためのポイントが整理できると幸いです。
セルフサービスBIの定義と特徴
最新のBIを表すトレンドの一つがセルフサービスBIと呼ばれる概念です。多くの調査会社やベンダーがいろいろな表現を使ってセルフサービスBIを定義していますが、シンプルに表現すると「データ分析の専門家ではない一般のビジネスユーザが、IT部門の支援を受けることなく、非定型なデータの分析を行うことのできる環境」ということになるかと思います。
このシンプルな文章の中に、今までのBIとは異なるセルフサービスBIの3つの特徴が含まれています。
- データ分析の専門家ではない一般のビジネスユーザ
- IT部門の支援を受けることなく
- 非定型なデータの分析
順番は前後しますが、3つ目の「非定型なデータの分析」から説明していきます。「非定型なデータの分析」ができることがセルフサービスBIの特徴であるとすれば、現在のBIでは「定型的なデータ分析」しかできないということになります。現在のBIでは、分析軸、計算値及びクロス集計表や棒グラフといった表現形式があらかじめ決められていて、一般のビジネスユーザは、いわば与えられた分析結果からビジネス上の判断を行うことが求められています。
一方で、一部のビジネスユーザは、ビジネス上の新しい課題に対処するために、現在のBIでは提供されていない分析軸、計算値、表現形式、あるいは現在のBIでは入手できない種類のソースデータ(分析の元となる生データ)を必要としていますが、これを提供してくれるのがセルフサービスBIということになります。
2つ目の「IT部門の支援を受けることなく」が、セルフサービスBIの特徴をもっとも直接的に表現しています。ビジネスユーザが、IT部門にリクエストすることで、新たな分析軸、計算値、表現形式、あるいは新たな種類のソースデータを手に入れることは理論的には十分可能ですし、現実解として実際に行われているプロセスでもあります。しかし、このやり方では時間と工数がかかってしまい、ビジネス上の要求に追いつけないという問題があります。セルフサービスBIでは、これらの作業をビジネスユーザが自分自身(セルフサービス)で行うことで時間と工数の問題を解決することが期待されています。
1つ目の「データ分析の専門家ではない一般のビジネスユーザ」の意味は若干複雑です。現在のBIでは多くの場合、定型分析しか提供されない不満の解消策として「非定型なデータ検索と抽出」機能が用意されています。この機能を使えば、データウエアハウス(分析用に用意されたデータベース)、さらには業務系アプリケーション(会計、販売管理など)から分析に必要と思われるデータを自分自身で検索し、抽出するところまではできます。しかし、その先のデータの加工、集計、グラフ作成といった分析プロセスについては支援ツールが用意されていないため、エンドユーザはこの部分をExcelやAccessといったデスクトップ型の汎用ツールで行うことになります。
汎用ツールはエンドユーザが普段使っているのでスキル修得に時間がかからないという利点がありますが、おのずと不足する機能も存在します。例えばExcelの場合、集計やグラフ作成の範囲ではかなり強力な機能を備えていますが、データの加工という面では機能が足りません。また、デスクトップ型であることから、分析結果の共有や最新データへの更新に手間がかかってしまい部門レベル、全社レベルでの運用に耐えられないという問題もあります。
一方、汎用ツールに欠けているこれらの機能を満足する専用ツールは、統計解析ツールあるいはデータマイニングツールという形で以前から提供されています。しかし、これらはあくまでも「データ分析の専門家」向けで、使いこなすためには、統計を中心とした高度なデータ分析知識が前提となります。
このような汎用ツールと専門家向けツールのギャップを埋めるべく登場したのが、セルフサービスBIツールと呼ばれるタイプの新型のBIツールです。つまり、セルフサービスBIツールは、今までのBIツールの代替としてではなく、現在のBIの限界を陰で補完しているExcelの代替として登場したことになります。
そもそもBIは初めから「セルフサービス」だった
セルフサービスBIの登場には、ビジネス上の新しい課題に対処するために、現在のBIが提供していない非定型な分析が必要になったという背景があります。しかし、このようなニーズは確実に以前から存在していました。企業のIT投資項目として重点項目の一つであるはずのBIが、なぜ今までこのような明白なニーズに対応していなかったのでしょうか?この疑問を解くためには、黎明期から今までのBIの変遷を理解する必要があります。
BIということばが一般的に用いられるようになったのは、1990年前後のことです。この頃は、ITアーキテクチャの大変革期にあたり、それまでメインフレームを中心とした集中型のシステムが、UnixサーバとWindows PCで構成される分散型システムに急速に移行した時期でもあります。この分散型システム・アーキテクチャは、当時クライアント・サーバ型と呼ばれ、この新しいアーキテクチャで構成されたシステムのもとで、今までIT部門が一手に引き受けていたアプリケーションの開発やデータの加工・集計といった業務の一部をエンドユーザが行うようになりました。
エンドユーザに開放されたこれらの業務は、前者はEUD(エンドユーザによるアプリケーション開発)、後者はEUC(エンドユーザによるコンピュータ利用)という概念であらわされ、それぞれの概念を具現化するためのソフトウエアが数多く登場しました。初期のBIツールとは、まさにこのEUCを実現するためのツールであり、「エンドユーザが自ら、IT部門の支援なしに、データの加工・集計を行う」のが目的でした。
この時期のBIツールには、いくつかのタイプが存在しましたが、その中でもっとも広く利用されたものが、クエリ・アンド・レポーティング・ツール(以下Q&Rツール)です。Q&Rツールは、文字どおりデータベースを検索(クエリ)し、レポートを作成(レポーティング)するためのツールです。ただし、想定されるユーザは、データベースやプログラミング言語の知識を持たない一般のビジネスユーザであるため、(1)ユーザ辞書、(2)SQLの自動生成、(3)GUIによるフォーマット作成の3つの機能が必要条件とされていました。
「ユーザ辞書」とは、物理的なデータベースのテーブルや列の名称を、意味のわかりやすい単語に置き換える機能です。例えば、「order_d」というテーブル名を「注文伝票の明細」に、「prod_qty」という列名を「商品の数量」に置き換えることで、一般のビジネスユーザでも、データの内容を簡単に理解することができるようになります。「ユーザ辞書」では、単純な置き換えだけではなく、文字列操作や計算によって求められる新しい列を、データベースに変更を加えることなく、論理的に作成する機能もあります。例えば、「単価×数量」という計算式から「金額」という列を作成したり、「姓」と「名」の2つの文字列を結合させて「姓名」という列を作成することができます。
「ユーザ辞書」でテーブルや列名をビジネス用語に変換することで、一般のビジネスユーザでも、自分でほしいデータがどれであるかを簡単に指定できるようになりますが、実際にデータベースで検索を実行するためには、通常は「SQL」と呼ばれるデータベース言語でのプログラム作成が必要になります。Q&Rツールには、ユーザが指定したデータを検索するために必要なSQLプログラムを自動生成する機能があります。この機能により、SQLを全く知らない一般のビジネスユーザでも、データベースの検索を実行できるようになりました。
実行した検索の結果は、単に文字列や数値の羅列に過ぎません。これをビジネス上の判断に利用するレポートとして完成させるには、罫線や伴う表やグラフとして表現する必要があります。BIが登場する以前は、この部分もIT部門が個別にプログラムを作成することで対応していました。Q&Rツールでは、表やグラフの形式を画面上で選択し、レポートのレイアウトをマウス操作で作成することができます。このような機能は、現在では当たり前のことになっていますが、当時はWindows PCの普及が始まったばかりで、一般のビジネスユーザにとっては画期的なものでした。
このように、初期のBIの概念は、「一般的なビジネスユーザが、IT部門の支援なしに、データベースを非定型に検索し、レポートを作成する」というものでした。これは、最近のセルフサービスBIの概念とほとんど同じもので、90年前後に普及が始まったBIが、そのままの理念で発展していれば、今になってセルフサービスBIが改めて登場する理由はなかったはずです。