データサイエンティストを疲弊させてきた“分析前処理”が「Gemini」で改善!活用法を実例で解説
#6:Geminiと協働するデータサイエンス業務の新しい形
活用事例2:商品価格と販売個数の関連性分析
商品の価格が販売個数にどのように影響するかを理解することは、価格戦略や在庫管理を最適化する上でとても重要です。ここでは、商品カテゴリー毎に価格変動が売上個数に与える影響を推計し、スプレッドシート上で売上変化の簡易シミュレーションを行うという事例についてご紹介します。この事例では、商品の価格帯と販売個数の関係性をGeminiと共同でモデル化していきます。
データの可視化
au PAY マーケットでは、「グルメ・食品」や「レディースファッション」など、一番大きな区分だけでも30以上の商品カテゴリーが存在します。これらのカテゴリーごとに価格帯と販売個数の関連性を手作業で可視化・確認するのは骨の折れる作業です。
図8:カテゴリー別の価格帯と販売個数集計の結果例
[クリックすると拡大します]
データが準備されていれば、自然言語のプロンプトを入力するだけで、GeminiがPythonコードを自動生成・実行し、各カテゴリーの散布図を出力してくれます。
この後のモデリングも含めて今回は作業記録を残していきたいので、Gemini アプリの対話コンソールを利用します。データファイルを添付して以下のようなプロンプトを実行することで、カテゴリー別のグラフが一気に作成されます。
添付したファイルのデータを使って散布図を作成してください。
横軸:価格帯、縦軸:販売数、散布図は商品カテゴリー1別に作成
図9:カテゴリー別価格分布の可視化イメージ
[クリックすると拡大します]
モデルのアイデア列挙
データの可視化によって「価格と販売個数の間に指数関数的な減衰の関係がありそう」といった大まかな傾向が見えました。この関係を数理モデルで表現したいのですが、どういった方法があるでしょうか。下記のようなプロンプトで、Geminiに聞いてみましょう。
価格と販売個数のモデルを作成しようと思っています。どういった手法があるか、列挙してください。
価格の上昇とともに販売個数は急激に減衰するような関係性があるようです。このような場合、どういったモデルを候補として考えると良さそうでしょうか?
Geminiへの問い合わせは、1回のプロンプトで完結させる必要はありません。人間とコミュニケーションする場合と同様に、やり取りを繰り返しながら、必要な情報を整理していくことができます。
図10:Geminiが返してくれた考察
[クリックすると拡大します]
やり取りの中で、Geminiはいろいろな可能性を提示してくれます。その中から、どういった手法を試してみるのが良さそうか選択していくことで、自分一人では見落としていた観点をフォローしてもらいながら、モデルの設計を進めることができますね。
価格と販売個数のモデル化
モデルのアイデア列挙の結果を受けて、まずはシンプルな統計モデルとして、指数モデルを利用してみることにします。ここでGeminiの効果が発揮されるのが、モデリングとモデルの比較を対話形式で進められる点です。改めて、Geminiを使って分布を可視化し、そこにモデルを当てはめてみます。
添付したファイルのデータを使って「カテゴリーA」カテゴリーの散布図を作成してください。
横軸:価格帯、縦軸:販売数
分布に指数モデルを当てはめてください
図11:指数モデル当てはめの結果イメージ
[クリックすると拡大します]
これだけのプロンプトですが、裏側ではpythonのコードが自動生成され、実行と結果出力がされています。
これまで、この手のモデリング作業では、Pythonの実行環境を準備し、モデル実装のためのソースコードを人手で実装し、実行する必要がありました。しかし、Geminiを活用すると、自然言語の指示を与えるだけで、Geminiが内部でPythonコードを自動生成・実行し、指数モデルの当てはめを完了させます。これにより、分析者はPythonのコーディングや環境構築の手間から解放され、モデリング作業のハードルが下がりました。
さらに、いくつかのカテゴリーにモデル当てはめを実行した後、その流れで当てはめ結果の評価に進めます。
ここまでの2つのモデルの精度指標を整理して、表でまとめてください。
図12:モデルの比較・評価の結果例
[クリックすると拡大します]
Geminiとの対話によって、決定係数(R^2)やRMSEなどの指標整理を効率的に行えます。これにより、商品カテゴリー間でモデルの当てはまりに差があることなどをすぐに把握できます。もし、モデルの精度が低いカテゴリーが見つかった場合でも、Geminiにどうすればいいか質問を投げかけることで、適切なモデル選択のためのアイデア(例:区間別でのモデル当てはめ、指数モデルなど別モデルの提案)を得ることができます。これにより、トライ&エラーのサイクルをGeminiと共同で回すことが可能になり、ビジネス適用手前の検討フェーズでの試行コストが削減されます。
Gemini アプリのチャットインターフェースであれば、対話のログも保存されるため、後からモデリングの試行錯誤の過程や結果を振り返ることもできます。これは、特に複雑な分析や継続的な改善が必要なモデリング作業において、有用な利点となります。
このように、Geminiは、データ可視化の省力化だけでなく、モデル比較を含む反復的なモデリングプロセスにおいても、対話形式で効率的な分析を可能にするツールとなっています。
この記事は参考になりましたか?
- Jagu'e'r発!Gemini活用大全連載記事一覧
-
- データサイエンティストを疲弊させてきた“分析前処理”が「Gemini」で改善!活用法を実例...
- 放送局での業務自動化に「Gemini」が大活躍──「AI関数」によるデータ分析/アプリ開発...
- 膨大な資料から必要情報を「Gemini」が抽出/オンライン会議の議事録作成からバーチャル背...
- この記事の著者
-
奥野 源(オクノ ハジメ)
auコマース&ライフ株式会社リードデータサイエンティストとして、総合ショッピングサイト「au PAY マーケット」の統計分析業務に従事Jagu'e'rでは、GWS分科会を中心にいくつかの分科会のメンバーとしてLT会での情報発信などの活動も行っています
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
この記事は参考になりましたか?
この記事をシェア
