2013年11月10日日曜日

【調査】ビッグデータの使い方1:確率論を用いた方法について

昨今、ビッグデータの幻滅期といわれ始めて久しいですが、ビッグデータ自体は事象であるため、見捨てるか、拾おうと努力し続けるかで先行者メリットの有無が決まってきそうだと思っているマルオカです。こんにちは。

今回はビッグデータの内、顧客の購買データとデータ分析の方法を紹介します。

顧客の購買データの売買が流行ってきた

ビッグデータというと、バズワード(雰囲気をあおるだけの言葉)のように聞こえますが、事象の説明と理解したほうがよいです。市場ではビッグデータとは別の言葉ですが、俗に言うビッグデータと呼ばれるデータのやりとり、あるいは分析でビジネスを実施している企業はあるのです。

DocomoやCCCは優良で購買情報を売るし、Yahooやアスクルは無料で購買情報を提供するようです。

で、いよいよ始まりだしたビッグデータの使い方の初級編をまとめます。


顧客の購買データって何の役に立つの?

購買データがあると何がわかるか?

答えはいくつかあるけど、代表的なものとしては「現在の流行がわかる」あるいは、「今後の売れ行きがわかる」といったところでしょうか。

「流行がわかる」といった方がイメージしやすいかな。

流行・・・例えば、携帯電話カバーの開発メーカーがいたとして、必要な情報は、

どの機種のカバーを作れば、一番儲かるか。どのタイミングで切り替えるか。

ということかと思う。
このとき、流行、例えば
最近、ガラケーよりもスマホが売れている。DocomoではXperiaの販売台数が最大だが、最近はiPhoneが売れており、伸び行きが著しく、おそらくiPhoneがXperiaを追い抜くだろう
ということがわかったとき、タイミング如何はあるものと、大筋としてはXperiaもしくはiPhoneを作ればいいのだと考えるだろう。

この、「おそらくiPhoneがXperiaを追い抜くだろう」を「N%の確立で追い抜くだろう」に言い換えてくれるのが確率論だ。

確率論って難しそう。いやいや、概念はわかりやすいですよ

せっかくなので、確率論(初級編)を掲載します。

つっても、確率論なんて、情報論者や経済論者じゃないと、多分知らないんだろうなぁ・・・と思っていたりするので、以下のようにざっくり、2つに分岐させた。超ざっくりだけど。
  • 古典的な確率論
    • サイコロを振ったとき、2が出る確率。
    • この場合は、これから起きる事象の発生確率は過去の事象に依存しない
    • つまり、世間の過去実績(流行)に基づく売り上げ確立がわからない!
  • 昨今の確率論
    • 過去の実績から、今後の売り上げ確率がわかるような理論
    • それがベイズ確率論なのだっ!!
ちゅーわけで、ビッグデータを分析する際に、ベイズ確率論は超、便利。
というわけで、勉強してみましょう。

以下のスライドは人様のですが、非常にわかりやすいのでメモとしてリンクしておきました。
興味がある方に限定されますが、ご参考までに。



ではまた。