MySQLのデータ利活用の課題
MySQLはWebアプリケーションのバックエンドとして多数の更新処理をあつかうデータベースとして利用されることが多くあります。一方でこれまでは大量データの集計や分析のための機能は限られていたため、他の分析用の製品などを組み合わせて運用されることが見られました。この構成ではデータストア間でのデータの同期が必要となり、運用のコストや負荷、データの鮮度の維持が課題となります。
データの鮮度の維持
データの鮮度は分析結果の正確性に直結します。データストア間でのデータを移動すると、処理に伴う遅延が発生します。そのため最新のデータを分析対象とできず、データ分析の結果をビジネスの判断に反映する際に最新の状況とのずれが生じる可能性があります。
潜在的なコストの増大
複数のデータストアを運用し、さらにデータを同期させるためのETL(Extract, Transform, Load)ツールを組み合わせると、製品の利用コストだけではなく複雑化したシステム環境を管理するコストも増加していきます。また同じようなデータが繰り返し複製されることはストレージに関するコストを無駄に増やすことにもつながります。
セキュリティ
複数に分かれたデータストアに加えて、移動するデータに対しても閲覧できる権限の制御が求められるためセキュリティ運用が複雑化し、誤った設定による不正アクセスや情報漏洩のリスクが上がります。機械学習のためにアプリケーション側にデータストアからデータを抜き出すことも、データの格納先とそれ以外で設定したセキュリティの境界を崩すことになりかねません。