【ビッグデータとは何か?】定義を知ることから始めよう!
ビッグデータとは何か?
「ビッグデータ」や「AI(人工知能)」という言葉をよく目や耳にすることが急激に増えてきましたね。
これらの用語に関連した「シンギュラリティ(2045年にAIが人類の知能を超える転換点、技術的特異点)」という専門用語も見聞きすることでしょう。
ビッグデータとAIは不可分の概念です。この点は問題ないと思っています。
問題は、私たちはこれらの用語の「定義」をよく知らずに、日常会話の中で使っていることです。
新しい概念が登場したら、最初にやるべきことはその「定義」をすることです。これはすべてにおいて当てはまることです。
「定義」を知ったかぶりをしてしまうことがよくあります。
間違っていたり、勝手な解釈をした上で話したり、書いていることがあります。
なぜ、「定義」がそんなに重要なのでしょうか?
それは、同じ用語を使っていても「定義」(解釈と捉えても良いでしょう)が異なると、全く話が噛み合わなくなる恐れがあるからです。
誤解を生じさせることさえあります。
この点は、注意が必要です。
人によって、考え方が異なることまで否定しているわけではありません。
共通のステージに上がって、その上で自分たちの考えを提示し、話し合うことが重要だと言っているのです。
前置きはこのあたりにして、本題に入ります。
ビッグデータ
ビッグデータとは何か?
手元にある新書の中に次のような記述があります。
ビッグデータの2つの側面
「ビッグデータという考え方には2つの側面があります。
1つは、『膨大なデータを扱う』という側面。もう1つは『データを処理・分析して活用する』という側面です」
出典元:『ビッグデータの覇者たち』海部美知 講談社現代新書
2013年4月20日第1刷発行
Google検索は多くの人が利用していることでしょう。
Googleは膨大なデータ(ビッグデータ)を蓄積し続けています。量だけ集めてどうするのだろう、と考える人がいますが、Googleが膨大なデータを収集してきたことには大きな理由があります。
「『データというものは、量をたくさん集めていけば、どこかの時点で質に変わる』という技術と思想が生まれてきたのです」
量から質への転換ですね。
面白い発想です。
最初に「ビッグデータの定義を知ろう」と書きました。
ビッグデータの定義
「ビッグデータ(Big Data)とは、従来のデータベース管理システムなどでは記録や保管、解析が難しいような膨大なデータ群のことです」
という定義を見ました。
出典元:Ledge.aiのサイト
ところが、「明確な定義があるわけではなく、企業向け情報システムメーカーのマーケティング用語として多用されています」(IT用語辞典より抜粋)ということです。
つまり、上記の定義は1例に過ぎないということになります。
明確な定義がなくても、はっきりしていることがあります。
それは、「ビッグデータは4つのVで表される」ことです。
4つのV
Volume(量) ビッグデータの「ビッグ」はそのデータ量を表す
Velocity(速度) データが受け取られ、処理されるまでの高速な速度の
こと
Variety(種類) 利用できるデータが多様であること
Value(価値) そのデータがどのくらい信頼できるかということ
出典元:Ledge.aiのサイト
では、ビッグデータを用いた分析方法にはどのようなものがあるでしょうか?
ビッグデータの分析方法
3つのステップで分析するそうです。統合、管理、分析です。
1.統合
「ビッグデータは、種類の異なる多数のソースやアプリケーションからビジネス上の課題解決に必要となるデータを集める」
2.管理
「データがどんな構造であれ、それを格納する環境を整備することが重要」
3.分析
「収集したデータを分析し、ビジネス上の課題解決につながるような知見をあぶり出す」
次に、ビッグデータはどのような分野で応用されているか見てみましょう。
ビッグデータの応用分野
現在では、医療、環境、教育、小売の分野で応用されているそうですが、今後さらに応用が拡大されていくことでしょう。
例えば、日々の膨大な売買データを取り扱う金融業界や、車の自動運転の完全実用化あるいは安全性向上のための膨大なデータ分析が欠かせない自動車業界などへの応用が期待されていると考えられます(これらは私見です)。
あるいは、音楽業界や映画業界にも応用されるかもしれません。
快い気持ちにさせ、心身ともに健康維持向上に貢献する歌詞やメロディーや動画の作成も考えられるかもしれません。
クラシック音楽からポピュラー音楽に至るまでの膨大な音声データを解析し、既述の音楽を大量に作り出すことは可能ではないかと思っています。
感動を与える動画の制作も過去の名作のビッグデータを解析し、全く新しい動画を作り出すことも可能性としてはあると考えています。
大ヒットするかどうかは分かりませんが😁
ここまで話が進んできますと、必然的にビッグデータとAIとの関係に触れないわけにはいきません。
なぜならビッグデータとAIは切っても切り離せない関係にあるからです。
ビッグデータとAIの関係
機械学習(マシンラーニング)やディープラーニング(深層学習)の進化に伴い、画像認識の精度が向上し、さらに音声などのビッグデータの分析・整理が可能になってきました。
そして、ディープラーニングの精度向上のためにはビッグデータが欠かせません。
そうした意味で、データの扱いに長け、AIの開発にも関われるデータサイエンティストが俄然注目され、需要が拡大しています。
ビッグデータが抱える課題
問題点は2つあります。
問題1 データの整理に時間がかかる
今データ量は2年おきに2倍に増えているそうです。
「ビッグデータを整理し、クリーンデータ、つまり顧客にとって適切で、意味のある形で分析できるように整理されているデータ、を用意するにはかなりの労力が必要になります」
問題2 プライバシーの取り扱い
「ビッグデータにも個人情報が含まれることがあり、無断でデータを活用するとプライバシーの侵害にあたる可能性があります」
「ビッグデータは科学と似て、『諸刃の刃』になり得ます。間違った使い方をすれば、人びとに害をもたらす可能性は拭えず、正しい使い方をすれば、人びとや社会にプラスの影響を与えることもできる」
出典元:Ledge.aiのサイト
🖊 まとめ
◎ ビッグデータの明確な定義はないが、Volume(量)・Velocity(速度)・Variety(種類)・Value(価値)の4つのVで表される
◎ ビッグデータの分析方法
統合、管理、分析の3ステップで分析する
◎ ビッグデータの応用分野
医療、環境、教育、小売の他に金融業界や自動車業界、音楽業界、映画業界にも応用される可能性がある
◎ ビッグデータとAIとの関係
ビッグデータとAIは切り離せない
機械学習(マシンラーニング)やディープラーニング(深層学習)の進化に伴い、精度向上のためにはビッグデータが欠かせない
◎ ビッグデータが抱える課題
問題1 データの整理に時間がかかる
問題2 プライバシーの取り扱い
⭐ ビッグデータとAIについては別の機会に取り上げます。
サポートしていただけると嬉しいです。 サポートしていただいたお金は、投稿のための資料購入代金に充てさせていただきます。