SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

DB Online Day 2018 Powered by IBM(AD)

「AI Ready」な企業データはどのようにして作るか?

IBMのデータプラットフォーム基盤 データ整備の鍵はEnterprise Catalog

 先述した「AI Ready」(データ活用)の実現に必要なプロセスにおいて、要点を抜き出すと4つ。最初にデータを「収集」し、そのデータを「整備」し、そのデータを「分析」できるようにして、最終的には「AI」でよりよい洞察を得られるようにする。IBMの強みはこれらのプロセスを網羅するように、幅広い製品やツールを扱えるというところにある。

 例えばデータの「収集」ではあらゆるデータソースから収集することになる。必要なデータは構造化データから非構造化データなど、様々なシステムに格納されている可能性があるためだ。IBM Db2や他社リレーショナルデータベース、さらにNoSQLやHadoopなど、幅広く扱える必要がある。

 またデータの「分析」を行うのはデータサイエンティストとは限らない。アプリ開発者、業務の専門家、ビジネスアナリストなど、さまざまな立場がそれぞれの目的に応じてデータ分析を行う。立場や目的により、R Studio、Jupyter Notebook、SPSSなど使うツールが異なるのが実状だ。

 三澤氏は「IBMはあらゆるデータファイル・システムを扱えるように注力しており、またあらゆるデータ分析ツールを使えるようにお手伝いしています」と話し、カバー範囲が広いことを強調する。

 さらに重要なのがデータのガバナンスだ。元の目的、つまりデータやAI活用を考えると、すぐに分析に使えるように整備されたデータが必要になる。三澤氏は「IBMにはデータカタログというソリューションがあります。IBMが大きく差別化できるところです」と胸を張る。

 データカタログとはあらゆるデータソースから収集したデータをAIで自動分類し、メタデータ管理だけではなく、マシンラーニングで使うような学習データや学習モデルの生成も行い、それらをカタログ化するもの。カタログ化することでデータの検索や共有からガバナンスまで行えるようにする。これらを統合的に行うのがIBMの「Enterprise Catalog」だ。あらゆるデータソース、データ分析ツール、AIを網羅できるようなデータ整備基盤を目指している。

スライド10枚目:Any Dataから、Any AIを実現するEnterprise Catalog
Any Dataから、Any AIを実現するEnterprise Catalog

 この「Enterprise Catalog」が行うデータ管理の特徴は3つある。1つめはデータ利用者が分かる言葉、つまりビジネス用語を用いていること。2つめはどのようなデータソースからどのようにデータが生成されたか、来歴(リネージュ)を管理していること。3つめはデータ構造を理解してメタデータを管理していることだ。これらは「Enterprise Catalog」の統合UIから確認できる。

 システム環境に目を向けよう。データソースはオンプレミスからクラウドまで分散している可能性があり、データプラットフォームは俊敏性と移行性が高いことが望ましい。そこでデータ整備基盤にはコンテナ(Docker)やKubernetesを用いることでデータとアプリケーションは場所を選ばず配置し、移動も可能にしている。

 IBMの統合データプラットフォーム基盤をIBM Cloud(パブリッククラウド)で実現するのが「IBM Watson Studio」、オンプレミスや各種クラウドを組み合わせたハイブリッドクラウドで実現するのが「IBM Cloud Private for Data(ICP for Data)」だ。違いは場所(オンプレミスか、いずれかのクラウドか)と管理者権限だ。前者の「IBM Watson Studio」ならフルマネージドになる。実現できることはほぼ同じ。

スライド16枚目:コンテナ/Kubernetesによるハイブリッドクラウド&マルチクラウド
コンテナ/Kubernetesによるハイブリッドクラウド&マルチクラウド

次のページ
これからはWatsonがますます身近に 次の課題解決に向けてAIのマネージも

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
DB Online Day 2018 Powered by IBM連載記事一覧

もっと読む

この記事の著者

加山 恵美(カヤマ エミ)

EnterpriseZine/Security Online キュレーターフリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Online の取材・記事も担当しています。Webサイト:https://emiekayama.net

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/11521 2018/12/21 10:14

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング