SAA学習メモ5

今回はセクション11「データベース」です!

11. 「データベース」

いろいろなデータベース

- ビッグデータ向けDB->NoSQL
- 普通のアプリケーション向け->RDB
- データウェアハウス->Redshiftとか,データの抽出集約特化,列志向(<->RDB=行志向?),分析に使用
- データレイク->S3とか,データ抽出に特化,ビッグデータの高速処理向け
- キーバリュー型->Redisとか,シンプルなデータ構造&高速処理
- ワイドカラム型->DynamoDBとか,キーとカラムが入れ子構造になっている

DynamoDB

- 完全マネージドなので冗長構成をユーザがする必要はない
- 簡易なクエリ&大量同時アクセスが求められる処理に向く
- TRANSACTION&ROLLBACKできない
- 大量データ読み書きはコストがかかる

DynamoDBユースケース

- ビッグデータ処理:Hadoopと連携できる
- アプリケーション:多数のユーザが同時アクセスする場合などに向く
- ユーザ行動データ管理:ゲームや広告等のユーザの行動ログ管理など
- バックエンドデータ処理:モバイルアプリのバックエンド,ストレージのインデックス

DynamoDB Streams

- テーブルに保存された項目の追加、変更、削除履歴をキャプチャできる機能
- 24時間以内のデータ変更履歴の保存ができ、24時間経つと消える
- Streamsでデータ更新をトリガーとしてクロスリージョンレプリケーションを実行したりするのも手
- アプリ側への通知にも使える

DynamoDB Accelerator(DAX)

- DynamoDBにインメモリ型のキャッシュ機能を付加する
- マルチAZDAXクラスターは1秒間に数百万件のリクエストを処理できる

Aurora

- 3つのAZに2つのコピーを設置可能
- 過去データはそのままS3に継続的にバックアップされる
- 99.99%高可用性、高耐久性
- リードレプリカは最大15まで
- RDS(MySQL,PostgreSQL)からAuroraへマイグレーション可能

Auroraサーバレス

- Auroraオンデマンド自動スケーリング機能
- 自動的に起動/シャットダウン
- 自動的にスケールアップ/ダウン

AuroraグローバルDB

- リードレプリカを他リージョンで構成する
- レイテンシは概ね1秒以下、最大でも5秒でレプリケーションを実行できる

EFS

- フルマネージド型サービス
- 使った分だけの従量課金
- サイズは自動で拡張縮小される
- データは複数AZに分散保存されている
- パフォーマンスモード
 - 汎用モード:一般的な用途、1秒あたりファイル操作は7000まで
 - 最大IOモード:何十から何百クライアントからの同時アクセス、レイテンシを犠牲にしてスループット優先
- バースト機能:一時的な性能向上

FSx

Amazon FSx For Windows File Server
-> Windowsファイルサーバのクラウド移行
  SMBプロトコル対応
Amazon FSx For Lustre
-> 高速コンピューティングを実現する分散並列処理専用ストレージ
  スパコンに利用されるような分散ファイルシステム
   最大数百GB/sのスループット
   数百万IOPSまでスケール可能

Kinesis

- Kinesis Streams:ストリームデータ処理を行うアプリ構築
- Kinesis Firehose:ストリームデータをS3やRedshiftに配信
- Kinesis Analytics:ストリームデータを標準的なSQLクエリでリアルタイム可視化、分析


この記事が気に入ったらサポートをしてみませんか?