データサイエンスで使用するデータとは?
みなさんこんにちは、いぬがすきです。
データアナリストへの道の第一歩を踏み出そうとしているサラリーマンです。
分析については全くのど素人なので、
『学んだ知識をビジネスに活かしていけるようにする』ことをゴールに勉強していきたいと思います📊
今回は、データサイエンスで使われるデータについてです!
ではみなさんも一緒に勉強していきましょう🐶
データ量の増加について
最近よく、ビックデータ、統計学、データサイエンス、人工知能、クラウド、IoT( Internet of Things)という言葉をネットや本など様々なところで耳にする機会が増えてきました。
上記のような言葉が、世の中に浸透し始めてから、Webや様々なデバイスから得られるデータの量が増えてきているそうです。
データ量が増えた理由としては、
・データを収集する手段が増えた
・データをさばくマシン性能の向上
・クラウドなどの技術の発展
などだそうです。
身近な例をあげると、Apple Watch などのスマートウォッチもそうですよね。
Apple Watchを通して、運動量や身体のデータなども簡単に取れちゃうと思うと、すごいと思う反面ちょっと怖いですよね💦
在宅勤務が増えてきて、歩く機会も減ったせいで0キロカロリーです、、、
これじゃ取られるデータもありませんね笑
データの種類について
続いてはデータの種類についてです。
みなさんの身の回りには様々な種類のデータが存在しています、とのことでした。
例としては、
・Excelのようなテーブルデータ
・提案資料や社内文書などテキストデータ
・顔写真等の画像データ
・システムの記録を残しておくための日々のログデータ
・音声データ
このように世の中には、様々な場所にデータが存在していることがわかると思います。
そして、ITの発展やマシン性能の向上により、日々データ量が増えているということが実感できました。
今日のまとめです!
・様々なテクノロジーの発展によってデータ量が増加している
・身の回りには様々な種類のデータが存在している
自分が気が付かないところにも、たくさんのデータがひそんでいそうですね。
自分の身の回りから、データなんじゃないかなと思うものを探してみると面白いかもしれません!
今度やってみたいと思います🤓
下記参考資料です。
この記事が気に入ったらサポートをしてみませんか?