Teradata Vantageがデータ解析の一連の作業を便利にします
データ解析の一連の作業は下記の1~4の繰り返し(トライ&エラー)です
【作業工程】
1.DB内の対象データ特定
2.DB内の対象データを解析用データに加工
3.解析用データをクライアントPCに移動
4.クライアントPCの解析ツールで解析を実施
DWHに格納された大量データや大容量データ(数百GB~TBクラス)
から必要なデータを抽出する(工程2)為に通常は『SQL』を記述する必要がありますが、データ関連の人材の教育の状況として
・大学でSQLは学習項目に含まれておらず、SQLはあまり得意ではない人が多い
・逆にPythonやRは学生時代に使っていて就職して直ぐに使える
という話を耳にします。
一方で、、
データ関連の人材の今後の推移は以下の通り年110%程度で増えています。(注目されている職業なので当然ですね)
では今後増えるデータ関連の方々が簡単にデータを扱えるようにするにはどうしたらいいでしょうか?
答えは簡単です。そう、Vantageを使えばいいのです。
ちょっと話がそれますが、ゲームについて考えてみてください。
昭和のゲーム機はみんな純正コントローラーを使うしかなかったですが
今は「アーケードタイプ」や「キーパッドタイプ」等、自分好みのコントローラーでゲームを楽しむことができます。
これはゲームの市場規模が昭和と比べて何十倍にも膨らみ、市場での競争の原理でいろいろなものが登場したことによるものだと私は考えます。
データウェアハウスだって
これからは 『データ関連ユーザーが使いやすいものを採用すべき』 ではないでしょうか?
我らがVantageは“データ関連の方々が簡単にデータを扱う為のDWH”です。
1.データ加工
SQLはもちろん、Python、R、(SAS)でDB内のデータを加工できる
・大量データや大容量データを高速処理
2.データ解析
SQL、Python、RでDB内のデータを解析できる
・クライアントへのデータロードは不要になる
・記述統計、データ変換、仮説検定、高度なアナリティクス(※)
※線形回帰、ロジスティック回帰、主成分分析、K-meansどんどん追加
当然、Vantage=セントラルデータウェアハウスですので解析ユーザーに使っていただきながら、並行してバッチ処理、バックアップ処理、BIツールのデータ分析も問題なく行っていただく事が可能です。
この記事が気に入ったらサポートをしてみませんか?