見出し画像

第1章 ビッグデータは日常と「天文学的に」違う  1 ビッグデータとは何か

 『データ資本主義』が2019年9月18日に日本経済新聞出版社から刊行されます。これは、その第1章の1です。

第1章 ビッグデータは日常と「天文学的に」違う

1 ビッグデータとは何か
◇ インターネットサービスの利用で生み出されるデータ
「ビッグデータ」と呼ばれる新しいタイプのデータが、経済や社会に大きな影響を与えるとして注目を集めている。ビッグデータを収集し、それを活用できる企業が今後の経済活動を支配するともいわれる。
「ビッグデータ」は「巨大なデータ」という意味だ。では、それは従来から用いられてきたデータや情報とどこが違うのか? また、ビッグデータは、なぜ重要なのか?
本章では、こうした問題について考えることとする。
まず、ビッグデータとはどのようなものかを見ることにする。
人々が日常生活においてインターネットをさまざまな場面で利用するようになったため、サービス提供者が新しいタイプのデータを入手できるようになった。
たとえば、メールを送ったとする。その情報は相手に届くだけではない。メールを運営している主体(Gmail であればグーグル)も、その情報を入手し、利用することができる。
検索の際に「誰がどんなキーワードで検索したか」というデータや、カレンダーに記入した情報についても同様だ。マップの利用経歴やウェブショップでの購入記録なども、そうだ。SNS(ソーシャル・ネットワーキング・サービス)でどんなサイトに「いいね!」をつけたかという情報も、サービス提供者の手に入る。これらが、ビッグデータの重要な部分を構成している。
こうしたデータがサービスの提供者に利用されることは、必ずしも情報の発信者が意識しているわけではない。しかし、実際には利用される。そして、後で述べるように、そうしたデータが巨額の利益をもたらすようになった。
グーグルやフェイスブックは、こうした方法でビッグデータを集めた代表的な企業である。サービスは無料で提供されるが、それと引き換えに提供者がデータを得て利用するのだ。アマゾン・ドット・コムは、顧客の購入履歴という形でビッグデータを得ることができる。


◇ スマートフォンの利用で増大したビッグデータ
インターネットの利用拡大に加え、この数年でもう一つの新しい傾向が生じている。それは、スマートフォンの普及だ。
どこでも手軽に使えるので、これまでITに関係がなかった人々も利用するようになり、インターネットを通じて情報をやりとりする手段として主要なものになった。ついこの間まで、電車の中で人々が読んでいたのは新聞や書籍だったが、いまでは、スマートフォンを見ている人が圧倒的に多い。
多くの人がスマートフォンを日常的に使うようになると、その操作を通じて電子的な足跡を残すようになる。これによって、これまでよりもさらに大量のデータが集まるようになった。そうしたデータが、サービス提供企業に蓄積され、利用可能になったのだ。
われわれの行動はビッグデータの一部となり、企業のマーケティングに使われる。そうした変化が、知らないうちに進行しているのである。


◇ データや情報に関する基本条件が大転換した
従来の書店でも、売れ筋の本、客の性別、およその年齢などといったことは分かる。しかし、ある本を買った人がどんな人なのかは分からない。ましてや、その人が過去にどんな本を買ったかは分からない。ところが、アマゾンの場合には、その人の購買履歴が分かる。これを用いてアマゾンは、「レコメンデーション」(お薦め)というサービスを行っている(第3章の3参照)。レコメンデーションに使っているビッグデータは、アマゾンがウェブ店舗だからこそ入手できたものだ。
また、紙の切符を買って電車に乗っていた頃には、乗客に関するデータは、ラッシュアワーの時間帯がいつかとか混雑度が激しい区間はどこかなどといったマクロ的なものしか得られなかった。しかし、スイカ(Suica)などの電子マネーが用いられるようになれば、一人ひとりの乗客がいつ、どの路線を乗車したかを把握することができる。
われわれはいま、毎日、検索をし、ウェブページを閲覧し、メールで連絡している。そして、頻繁にウェブ店舗で購入している。それらの記録は、すべて収集され蓄積されて、ビッグデータになっている。それだけではない。スマートフォンからの位置情報データも通話記録も、蓄積されている。
こうして、われわれは、それと気づかぬうちに、詳細な「電子の足跡」をさまざまなところに残しているのである。企業の立場から見れば、詳細な個人情報があふれるほど手に入る時代になった。
これまでは、販売データの収集は容易でなかった。だから、サンプリングで一部のデータを集め、そこから全体を推測する必要があった(そもそも、統計学は、サンプルの分析から母集団の性質を推測するための手法である)。ところが、ビッグデータは、母集団そのもののデータだ。データや情報に関する基本条件が、大転換したのである。
なお、従来のソースとは異なるところからもビッグデータが得られるようになってきている。まず、インターネットで提供されるサービスが拡大し、これによってさらにデータが得られるようになる。また、電子マネーやIoT(モノのインターネット)もビッグデータの供給源となる。これについては、第8章で見ることとする。




この記事が気に入ったらサポートをしてみませんか?