見出し画像

ビッグデータって結局なに?

いつもお読みくださりありがとうございます。
高速検索技術の会社、フォルシア株式会社でデータクレンジングを担当しています上杉です。

皆さんは「ビッグデータ」という言葉を一度は耳にしたことがありますか?
データを持っている人は強い!ビッグデータが世界を変える!など、聞こえてくるパワーワードに反応して、「とりあえずデータを集めなきゃ.…」という焦りに駆られたことがある人もいるのではないでしょうか?

今回はそんな「ビッグデータ」の正体(定義)とは結局何なのかについて解説します。

そもそもビッグデータって何?

「ビッグデータ」というと、どうしても「ビッグ」というワードが先行してしまって、とりあえず多くの(容量が大きい)データを連想する人も多いと思います。

ですが実は、IT用語としては下記のように定義されています。

ビッグデータとは、従来のデータベース管理システムなどでは記録や保管、解析が難しいような巨大なデータ群。単に量が多いだけでなく、様々な種類・形式が含まれる非構造化データ・非定型的データであり、さらに、日々膨大に生成・記録される時系列性・リアルタイム性のあるようなものを指すことが多い。

IT用語辞典より抜粋

つまり、ビッグデータはデータの量(Volume)データの種類(Variety)データの発生頻度・更新頻度(Velocity)の3つのVが重要な要素と言えます。

ビッグデータがあれば、何ができるの?

学生時代に数学の統計に少しでも触れた方は、ビッグデータの活用方法も想像しやすいのではないでしょうか?いわゆる”数の力”を味方に付けた場合、現状の把握だけでなく統計に基づく需要予測ができることになります。

世のほとんどのビジネスは、お客様の未来の需要を読むことができれば先回りして売上チャンスを掴めるのではないでしょうか…?そう考えるとビッグデータの持つ力の巨大さを少しイメージしていただけるかと思います。

例えばの話

もしあなたが、ビックデータの存在しない江戸時代にタイムスリップし、豆腐を売り歩くことになったらどんなことに悩みますか?

豆腐売りが悩む原因

いつ売れば豆腐が売れるのか分からない(時間帯)
どこで売れば豆腐が売れるのか分からない(場所)
どんな日に売れば豆腐が売れるか分からない(天候・気温)
どんな人に売れば豆腐が売れるのか分からない(人・属性・履歴)
いくつ豆腐を作れば無駄にならないか分からない(売上量)

少し想像するだけで分からないことが多すぎて、毎日売り上げた記録をノートに書いていったとしても、需要予測ができるようになるのはいつになることやら.…
私なら途中で記録するのも諦めてしまいそうです。

もし豆腐売りがビッグデータを手にしたら

今度は、ある日突然あなた(豆腐売り)がビッグデータを手にしたと想像してみて下さい。
売れる場所について大量のデータ(Volume)があるだけでなく、時間帯や天候・気候などのデータの種類(Variety)も多様で、データの発生頻度・更新頻度(Velocity)も高く毎日の売上履歴が手に入ったとします。

賢いあなたは、当日の天候や気温を見て作る豆腐の数を調整して無駄にする豆腐を減らしたり、一番売れる場所や時間帯を狙って売りに行って売上高を伸ばせるのではないでしょうか。

実は昔も今も必要性は変わらない

ここまで読んで頂いた方はお気づきかと思いますが、実はビッグデータは今の時代に突然必要性が出てきたものではなく、昔の商売人も喉から手が出るほど欲していたものと考えられます。

ITの発達によってそんな貴重な物を持つ人が出現し始めました。同じ豆腐売りが同じ労力をかけて村中を売り歩いても結果に差がでるこの時代、ビッグデータの獲得や活用について一度考えを巡らせてみると、大きなビジネスにつながるかもしれません。

最後に

今回はビッグデータの定義やその有用性について説明しました。もしビッグデータが気になった方は、次回の続編もお読み頂けますと幸いです。

私達がご提供している製品「Masstery(マスタリー)」は、
多くの人手が必要だったデータ整備を自動化する画期的なデータクレンジングツールです。フォーマットの統一、カテゴリーの自動分類、独自の変換、差分情報の取得等、データ整備に必要なあらゆる機能をご提供しています。
Masstery 公式サイト:https://mstr.forcia.com/(データクレンジング) 
フォルシア株式会社 企業サイト:https://www.forcia.com/ (高速検索)

この記事が参加している募集

業界あるある

この記事が気に入ったらサポートをしてみませんか?