AWS Glue

 ETLツール
=データソースから、データ分析基盤に対して、データを統合するときに発生するプロセスのこと。

Ex)CSVファイルをApacheParquet形式に変換など

⚪︎データカタログ:データソースのメタデータを一元管理するためのデータストア。
         Glueを管理するためのテーブル定義、ジョブ定義などが含まれる。

⚪︎分類子:データ形式を評価してスキーマを推測する。

⚪︎オートスケーリング機能:あり

この記事が気に入ったらサポートをしてみませんか?