今回のテーマは「ビッグデータ」です。
出典: フリー百科事典『ウィキペディア(Wikipedia)』
データの収集、取捨選択、管理及び処理に関して、一般的なソフトウェアの能力を超えたサイズのデータ集合と定義される。
学問的(?)には、こういう意味なんですねぇ。(知りませんでした)
ただ、今回は、「収集される大量のデータ」という意味です。
具体的には、ここでいう「ビッグデータ」とはこんな内容です。
具体例その1
保育園をオープンするのに、5歳以下の幼児が多い地域を知りたい。
これがわからないと、保育園の運営が成功するか否かは、運任せになってしまいます。
しかし、もし、データベース化されている情報である「ビッグデータ」があれば、5歳以下の幼児の多い地域を絞って、そこで保育園をオープンすることができます。
そうすれば、運任せではなく、客観的に成功するか否かを判断できます。
具体例その2
これは、コンビニの例です。
これは、ビッグデータの収集の仕方をすぐに確認することができます。
コンビニの本部としては、
- どのショップで
- どの時間帯に
- 男性か女性か
- 何歳位の人が
- 何を購入したか?
こんな情報をデータベース化(ビッグデータ)できれば、顧客のニーズがわかり、売上を伸ばすことができるはずです。
逆に、これがわかれば、食品などの廃棄量も減らすことができるはです。
例えば、セブンイレブンで代金を支払う時に、レジを打つ店員さんの手元に注目してみてください。
セブンイレブンのレジは、定員さんが最後に右端のボタンを押すと「チン」とレジが開くようになっています。
この右端のボタンが、まさに「ビッグデータ」を収集する仕組みです。
右端のボタンは、青とピンクに分かれていて、それぞれに数字が書いてあります。
青は男性、ピンクは女性で、数字は年齢層です。
例えば
- どのショップで・・・・上野駅前
- どの時間帯に・・・・・午前7時15分
- 男性か女性か・・・・・女性
- 何歳位の人が・・・・・20歳代
- 何を購入したか?・・・ストッキング
を購入したとします。
すると、レジで代金を受け取って「ピンク」の「20代」のボタンを押すと、そのデータが、オンラインで本部のデータベースに蓄積されて、「ビッグデータ」になる、という仕組みのはずです。
コンビニの本部では、このような「ビッグデータ」を元に商品管理をしているんだろうなぁ、と感心しました。
今までの身近な「ビッグデータ」の集め方の欠点
セブンイレブンのバイトの人にこの「性別・年齢ボタン」について聞くと、おそらく、こういう内容の答えが返ってくると思います。
「最初の頃は、できるだけ正確に年齢のボタンを押すようにしていたけど、慣れてくると、男性か女性か、つまり、青とピンクのボタンの区別はしても、年齢に関しては、適当かな・・・」
つまり、収集した「ビッグデータ」の内容が不正確なのが欠点ですね。
しかし、データの命は正確性なので、これだとせっかくの「ビッグデータ」を十分に生かすことができませんよね。
現在の身近にあるより正確な「ビッグデータ」の集め方
「ビッグデータ」を集める側からすると
- いつ(何年何月何日何時何分)
- どこで(地域・具体的なショップ名など)
- 誰が(特定の人)
- 誰と(人数など)
- 何を(購入した商品・サービスなど)
- どうやって(現金かクレジットか)
- どうなった(完済できたか、など)
例えば、こんな詳細な情報を集めることができれば、「ビッグデータ」としては満足ですよね。
ここで、ポイントになるのが、データベースは、個人を特定するキーがあると、満足のいくデータベースを作成できる、ということです。
個人を特定できる、その人だけが持っている情報とは・・・・
- DNA
- 指紋
などがありますが、他には
- 携帯・スマホの電話番号(固定電話だと複数の人が使うので特定できません)
- メールアドレス
- ポイントカード など(例:T-ポイントカード他)
です。
携帯・スマホを契約するときに、名前、生年月日、住所などの個人情報を正確に記載しますよね。
ポイントカードについても、ほぼ同様です。
これらの情報があると電話番号やメールアドレスを紐付けて、正確な「ビッグデータ」を作成することができます。
つまり、携帯・スマホを使うと、それがインターネットを通じて、リアルに「ビッグデータ」ができあがっていきます。
コンビニなどで「○○カードはありますか?」と聞かれて、ポイントがつくからということで「はい」とポイントカードを使うと、「ピッ」と読み取った瞬間に、そこで購入した情報が、全部、「ビッグデータ」として蓄積されていきます。
こんな具合に、「ビッグデータ」は身近なところでリアルタイムで収集されています。
これって、とても怖いことだと思うのですが、こういう内容は、都合が悪いので、なかなか伝わらないですよね。
ただ、「怖い」からといって、利用しないわけにはいきません。
そこで、まずは、「怖いものだ」ということを肝に銘じて理解した上で、上手に利用することが大切だと考えています。
また、上記の保育園の例のように、「ビッグデータ」を利用する側から上手に活用していければ、と思います。