ビッグデータ分析基盤構築 ~その成功ポイントとは? / 杉村 麻記子

【1. プロローグ】
新聞では、ビッグデータやAIに関する記事が毎日のように新聞紙面に登場しいる。
また、ITC京都のメールマガジンでも、これらに関する記事も多数投稿されている。
本稿では、ビッグデータ分析の基盤構築を成功に導くための3つのポイントについて説明する。

【2. ビッグデータ分析基盤を構築する手順】
ビッグデータを分析基盤の構築手順は以下のとおりである。
1) ビジネス課題の抽出
 分析をするのが目的ではなく、解決したいビジネス上の課題、新たに導入したい取り組みなど、真の目的がなにかが重要となる。
 まず初めに分析をする目的を明確にする。
2) 課題解決方法の仮説設定、分析方法の検討
 1) で検討したビジネスの課題や目的に対して、その解決方法にはどのようなものがあるか ?分析を行う場合はどのような手法が有効か ? その仮説立てて、企画を進めていく。
3) システムデザイン(ツール検討)
 課題、分析手法などの企画が進めば、それを実現するためのシステムデザイン、具体的なツール選定などを行うこととなる。
4) システム計画・設計
 システムのデザインが決まると、それを具現化するための計画や、実際の設計を行うこととなる。
5) システム構築
 設計内容に従い、実際のシステム構築を行う。
6) 分析業務運用
 構築された仕組みを使いながら、目的達成のために日々の業務(分析後有無)を遂行する。

 

 これらの手順には注意をしなければいけない3つのポイント(ギャップ)がある。
 この3つのギャップを埋めることが成功のために必要となる。

【3. 一つ目のギャップ】
 一つ目は、<ビジネス課題の抽出>と<課題解決方法の仮説設定、分析方法の検討>の間にあるギャップだ。これはIT導入の時によく陥りがちな失敗である。
 例えば、
 「当社でもビッグデータ分析をやっていきたい!」
 「こんなデータがあるけど、何か分析できないか?」
 「このディープラーニングのサービスを使ってみたい・・」
 ITコーディネータの方や、ITベンダーの方なら、こういう相談を受けたことがあるのではないか?
 そこで、
 「ところで何のためにそれは必要なのでしょうか ? 」
 こんな質問をしてみると、顧客満足度を上げたい、業務を効率化したい、製品の品質を上げたい、売上を上げたい・といった漠然とした目的が返ってくることも多い。
 ビッグデータ分析、実行の基盤を導入するには、相応の投資が必要となるが、課題が不明確で、期待できる効果が見えていないと投資の決定がなされないことになってしまう。
 回避するためには、現状を把握し、課題の明確化、解決策の検討、業務面、システム面での計画策定とリソース配分が必要となる。一つ目の成功ポイントは、通常のシステム化計画を策定するプロセスを実行するのと同様である。

【4. 二つ目のギャップ】
 二つ目は、<課題解決方法の仮説設定、分析方法の検討>と<システムデザイン>の間のギャップだ。ビッグデータを扱うときのシステム的な観点からのポイントとなる。


 ビッグデータでは、経営情報のような構造化データのみではなく、センサーのログやメールやSNSのつぶやきといったテキスト情報など構造化されていないデータを取り扱うことになる。大量のデータ、異なる種類、リアルタイムな対応を求められるなどすべてにこれまでとは異なり、ビッグデータを取り扱う分析基盤では、パフォーマンスや拡張性など注意が必要となる。
 本当にいま設計しているシステム構成で、期待通りの働き(パフォーマンス)をすることができるのか ? 設計が甘くて必要なパフォーマンスが出ないといったことはいわゆる論外だが、リスクを想定して、過剰な投資をすることも避けたい。
 このような状況を解決し成功に導くには、事前の検証が必要だ。
 システム(インフラ)基盤は、最近はクラウドでサーバーやデータベースを使用量に応じて貸し出すサービスが一般的になっている。これらのサービスを利用して検証環境を準備する方法もあるし、お客様用の検証環境を準備しているベンダーに協力を依頼してする方法もある。特定のメーカー製品だけではなく、マルチベンダーの製品を検証できる環境もあり、専任のエンジニアがもつノウハウを活用しながら、事前に自社のデータを使っての検証を行うことが二つ目の成功ポイントとなる。

【5. 三つ目のギャップ】
 三つ目は、<システム構築>と<分析業務運用>のギャップである。
 システム構築自体が目的となってしまい、そのあと運用をしていくための体制や業務のプロセスが出来上がっていないため、ビッグデータ分析の目的が達成できないといった事態に陥ってしまう。
 ビッグデータ分析は、「データサイエンティスト」が必要といわれている。
 このデータサイエンティストとは、
 ・ビジネススキル
 ・分析スキル
 ・ITスキル
 この3つの要素を兼ね備えた人という定義が一般的だが、実際このような人材を確保するのは非常にむつかしい。実際に社内で分析を使ってビジネス課題を解決するためにはこれらのスキルを組み合わせて業務をまわしていく必要があるのだ。
 そこでこの三つ目のギャップを埋める方策としては、「チームデータサイエンティスト」を育成することとなる。
 この組織化、育成の計画を、ビッグデータ分析基盤構築の段階から策定し、システムや業務のプロセスを検討するときに合わせて、組織や人材を作っていくことである。
  仮説を立てて、それに必要な情報を洗い出し、統計的な観点から分析を行い、その結果を踏まえて業務で実行し結果をフィードバックする・・・といった、一連の流れを、複数メンバーでこなしていき、各人のできる範囲を徐々に広げていくように会社として組織的にサポートをしていく。
  AIやDeepLearningが今まで以上に身近なものとなっても、この企画~検証~改善部分は人間の知恵が必要となる。このような人材を育成するための計画をあらかじめ策定しておくことが三つ目の成功ポイントとなる。

【6. エピローグ(まとめ)】
 このように、ビッグデータ分析基盤を成功に導くためには、
  (1)目的、課題を整理し計画を策定する
  (2)取り扱うビッグデータについて、事前のシステム的な検証を行う
  (3)システム構築のみならず、人の教育や組織作りも計画に盛り込む
 の3つのポイントが重要となる。
 今後プロジェクトを進められる際に、皆様の参考になれば幸いである。

------------------------------------------------------------------------
■執筆者プロフィール

杉村麻記子
ITコーディネータ・中小企業診断士