連載コラム『データ分析』
昨今、”ビッグデータ”や”IoT”、”データ分析”という単語が世間で聞かれますが、「結局どういうことをしているのかわからない」という声も多く聞かれます。
そこでこのコラムで数回に分けてデータ分析界隈の動向、ビジネス事例の紹介、将来性などについてご紹介したいと思います。

第1回 データ分析とは

2016.7.4

今回はそもそもデータ分析とはどういうものを指しているのか、という部分について紹介したいと思います。

データ分析の内容

データ分析と聞いていまいちピンと来ないのは、そもそもデータ分析という言葉の意味が広すぎるからです。
データを扱うものは全て当てはまってしまうのですが、ここでは分析作業として代表的なものについて例を交えながら紹介します。

データの集計・分類

大量のデータや複雑なデータを集計したり、分類したり、細分化したりします。
たとえば、大量のアクセスログを日ごとに集計し推移を見たり、アクセス元の地域ごとに分類したりすることで、どのような地域差があるかを見る、というようなことを行います。
例:ログの内容調査、アンケート結果の集計 など

データの可視化

文字や数値の羅列だけ見てもデータの中身がわからない場合が多いので、グラフにしたり図にしたりします。BIツールを使う場合もあります。
data1

関連調査・要因調査

物事の原因やデータ同士の関連を調べるということも行います。
同時に買われているものの関連を調べておすすめとして表示する仕組みなどはすでに広く実用化されていますね。
“ビールと紙おむつ”のエピソードも有名です。
事例:キャンペーンの効果測定、商品レコメンド など

分類分け

データの分布や類似性から集約や分類を行うものです。
ターゲット顧客の調査・競合調査などで、類似のグループを見つけるというように、営業戦略にも利用されます。
事例:ニーズ調査のための顧客分類 など

将来予測

過去のデータから将来を予測します。
株価予測などはイメージのつきやすい例です。
data2

図は様々なパラメータを変えながら、数値がどのように変化していくかをグラフ化した例です。
将来予測の考え方はシミュレーションなどにも利用されます。
事例:需要予測、売上予測 など

また、データを蓄積する基盤・高速に処理するためのインフラ構築業務や、データの見せ方・表現・根拠づけ・仮説などを考え、お客様をサポートするコンサル業務も広い意味ではデータ分析に含まれます。

業務でのデータ分析

このような意味の広さもあってデータ分析業務では○○をしています、というように言いにくいところがあるのは事実です。
上で挙げたようなもの以外にも、もっと泥臭い仕事も多く、いろいろなところから集めてきたデータをただただ綺麗にする作業などもあります。(データの形式がばらばら、整合が取れていない、必要なはずの項目がないなんていう状況も日常茶飯事です。)

このように数々の作業がありますが、データ分析業務自体には大きな流れがありますので紹介します。


①課題・問題の発生!
②まず検証に必要なデータを集める
③データを綺麗にして分析できるようにする
④集計や可視化を行い、人が理解しやすいようにする
⑤なんらかの示唆や仮説を得る ⇒ ②へ

そこから

⑥予測や分類モデル(規則)を作る
⑦ユーザが利用できるようシステム化する

と発展する場合もあります。(具体的な事例は次回以降に)

データ分析は、何か決まったものを作っているというわけではないのですが、データを元に新しい可能性を探っていくという楽しさがあります。
次回は、ニュースにもなったAlphaGo(アルファ碁)をテーマにデータ分析や人工知能の先端事例について紹介したいと思います。