DX推進が喫緊の課題
昨年、経済産業省から発表されたDXレポートでは、企業のデジタルトランスフォーメーション(以下、DX)が進まないことによって生じる可能性のある経済損失、いわゆる『2025年の崖』が話題になりました。
非常にショッキングな内容であり、発表から1年以上経過した今もなお、あちこちで取り沙汰されています。企業にとって急務となっているDXにおいてはとりわけデータ活用の必要性が高まっていますが、その障壁として挙げられているのが、部門最適なシステムが生み出すデータのサイロ化や、大規模なデータや非構造化データ(JSON、画像、音声などの構造化されていないデータ)へ対応可能なプラットフォームが社内に存在しない点、IT人材が不足している中で保守・運用に手がかかりすぎ、最先端の技術を担う人材を確保できないなどの点でした。
今必要なのは、あらゆるデータにアクセスでき、あらゆるデータから洞察を得ることのできる「近代的」かつ効率的なデータプラットフォームであり、これが企業のデータ活用、ひいてはDX推進の原動力となります。
データを“資産”として活用できるBig Data Cluster
データプラットフォームの近代化を検討する際、現在はメンテナンスコストの削減、拡張性の高さ、他サービスとの連携性などからPlatform as a Service(PaaS)型のクラウドサービスへの移行が肝心であると声高に叫ばれています。
それが一番理想形であるという理屈はわかるものの、すべてのシステムがクラウド利用に適しているわけではない、というのが実情であると感じます。
SQL Server 2019ではBig Data Clusterと呼ばれるビッグデータソリューションが登場しました。Big Data Clusterは、格納先のストレージにHadoop分散ファイルシステム(HDFS)を採用しており、構造化データと非構造化データの両方を格納することのできる、データレイクとして利用できるようになっています。
これらのデータを従来からのSQL Serverエンジンだけでなく、新たに搭載されたSparkで処理することが可能になっており、構造化データと非構造化データ、すべてのデータから分析情報をほぼリアルタイムで取得することができるようになっています。
この新たなビッグデータソリューションは、オンプレミスで利便性の高い近代的なデータプラットフォームを実現できる点から、特にデータをクラウドへ移行することが難しいお客様から高い評価を頂いています。
スイスのBalzano社は、病院と連携して医療画像診断を行うソフトウェアを開発している企業で、患者の医療情報を扱っているという側面からクラウド利用に大きな課題がありました。
しかしSQL Server 2019のBig Data Clusterによって、構造化データと非構造化データの両方を扱えるようになったために、データサイエンティストが行っていたデータの前処理が必要なくなりました。その結果、より専門性を必要とする作業に集中する時間を増やすことができたことで、開発効率が大幅に向上したとの効果を得ることができています。