SHOEISHA iD

※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

直近開催のイベントはこちら!

EnterpriseZine編集部ではイベントを随時開催しております

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けの講座「EnterpriseZine Academy」や、すべてのITパーソンに向けた「新エバンジェリスト養成講座」などの講座を企画しています。EnterpriseZine編集部ならではの切り口・企画・講師セレクトで、明日を担うIT人材の育成をミッションに展開しております。

お申し込み受付中!

data tech 2018 講演レポート(AD)

Microsoft Azureのデータ分析サービスを使い倒すには? 実例を元にツール活用方法を徹底解説

新人でも乗客をキャッチできるようにタクシーの乗客予測モデルを作成

 日本マイクロソフトでは、Azureを利用してデータ活用を思考されている顧客企業にデータサイエンティストやソリューションアーキテクトが技術的な支援を実施することがある。大内山氏も実際にそうした支援活動を行う1人。外資系IT企業でシステムエンジニアやデータ分析コンサルタントを経て、現在は日本マイクロソフトでクラウドソリューションアーキテクトをしている。

 例えばデータ分析活動を行う場合、主に8つのフェーズで構成されることが多い。ただし、この8段階はウォーターフォール的に上から下に流れるというよりは、必要に応じて行き来を繰り返すアジャイル型であるという。

データ分析サービスの8つのフェーズ 出所:日本マイクロソフト[画像クリックで拡大表示]

 最初にあるのが「ビジネスの理解」。データ分析はやみくもに進めるだけでは確かな効果は得られないことが多い。ビジネスの背景を知り、どのような課題があるかを把握し、何を目標にするのかをきちんと見定めていく必要がある。  

 大内山氏は架空のシナリオとしてタクシー会社の例を解説する。このタクシー会社では売上が伸び悩んでいる。特に巡回における各ドライバーの経験値の差が大きく、経験の浅い新人ドライバーの顧客獲得率が低い、というビジネス上の課題があったとする。

 そこで、その「経験の浅さ」をITによって補完できないかと考えたとする。その実現に向けて複数出されたアイデアのうち、実現性、将来性および開発コストなどを鑑みた結果、機械学習を用いてタクシー巡回エリア内の乗客期待数を予測し、かつ、各ドライバーへ予測結果を提示するような仕組みを最初のステップとして開発する。なお、次ステップ以降では乗車距離や最適ルートなどを考慮した需要予測だったり、ゆくゆくは顧客の顔および行動認識による異常検知など、本ステップを土台とした将来的な展開案を考えておくことも推奨している。

 方針が決まったら、実際のデータ分析作業へと進む。まずはデータを顧客から受領する。今回の例ならタクシー運行ログが1年分で約26GB、支払ログが1年分で約18GB。これらの置き場所となるのがクラウドのストレージだ。Azureの汎用的なオブジェクトストレージとしてよく知られているのは「Azure BLOB Storage」。最近ではこの進化形として、並列分散処理やビッグデータに最適化した「Azure Data Lake Storage」がプレビューで公開されている。 

 データを受領したら、次はデータの理解。「基礎分析」とも呼ばれる。データの内容を見ながら、要件の理解とデータの過不足を確認する。大内山氏によるとPower BIを使うことが多いという。  

 Power BIはデスクトップ版「Power BI Desktop」のほかにSaaS版「Power BI Service」もある。いずれもExcelを扱うようにすぐに利用できるのが特徴だ。ほかにも大規模向けには「Power BI Premium」、オンプレミスのレポート用に「Power BI Report Server」、アプリケーションに組み込むための「Power BI Embedded」がある。要件に応じて使い分けるといいだろう。  

 基礎分析の結果を利用して、分析設計として本分析に向けた様々な詳細事項の定義を実施していく。具体的には分析スコープ、データ加工方針、外部データを利用する場合の種類や取得方法など。タクシー会社の例なら、使用するデータは1年分、分析対象となるエリア、需要予測モデルは100m四方ごとの乗車人数予測といった具合だ。さらに、データの加工方針やクレンジング条件、または利用する外部データの具体的な情報が含まれることもよくある。いずれも顧客と一緒にPower BIのレポートなどを眺めながら、合意形成をしていくことが重要としている。

具体例:分析設計 分析設計には分析するデータの範囲やエリア、クレンジング方針などが含まれる 
出所:日本マイクロソフト[画像クリックで拡大表示]

次のページ
Azure DatabricksにAzure Machine Learning service…強力なツールが次々と登場

この記事は参考になりましたか?

  • Facebook
  • Twitter
  • Pocket
  • note
data tech 2018 講演レポート連載記事一覧

もっと読む

この記事の著者

加山 恵美(カヤマ エミ)

EnterpriseZine/Security Online キュレーターフリーランスライター。茨城大学理学部卒。金融機関のシステム子会社でシステムエンジニアを経験した後にIT系のライターとして独立。エンジニア視点で記事を提供していきたい。EnterpriseZine/DB Online の取材・記事も担当しています。Webサイト:https://emiekayama.net

※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です

【AD】本記事の内容は記事掲載開始時点のものです 企画・制作 株式会社翔泳社

この記事は参考になりましたか?

この記事をシェア

EnterpriseZine(エンタープライズジン)
https://enterprisezine.jp/article/detail/11537 2019/01/29 06:00

Job Board

AD

おすすめ

アクセスランキング

アクセスランキング

イベント

EnterpriseZine(エンタープライズジン)編集部では、情報システム担当、セキュリティ担当の方々向けに、EnterpriseZine Day、Security Online Day、DataTechという、3つのイベントを開催しております。それぞれ編集部独自の切り口で、業界トレンドや最新事例を網羅。最新の動向を知ることができる場として、好評を得ています。

新規会員登録無料のご案内

  • ・全ての過去記事が閲覧できます
  • ・会員限定メルマガを受信できます

メールバックナンバー

アクセスランキング

アクセスランキング