SAA学習メモ5
今回はセクション11「データベース」です!
11. 「データベース」
いろいろなデータベース
- ビッグデータ向けDB->NoSQL
- 普通のアプリケーション向け->RDB
- データウェアハウス->Redshiftとか,データの抽出集約特化,列志向(<->RDB=行志向?),分析に使用
- データレイク->S3とか,データ抽出に特化,ビッグデータの高速処理向け
- キーバリュー型->Redisとか,シンプルなデータ構造&高速処理
- ワイドカラム型->DynamoDBとか,キーとカラムが入れ子構造になっている
DynamoDB
- 完全マネージドなので冗長構成をユーザがする必要はない
- 簡易なクエリ&大量同時アクセスが求められる処理に向く
- TRANSACTION&ROLLBACKできない
- 大量データ読み書きはコストがかかる
DynamoDBユースケース
- ビッグデータ処理:Hadoopと連携できる
- アプリケーション:多数のユーザが同時アクセスする場合などに向く
- ユーザ行動データ管理:ゲームや広告等のユーザの行動ログ管理など
- バックエンドデータ処理:モバイルアプリのバックエンド,ストレージのインデックス
DynamoDB Streams
- テーブルに保存された項目の追加、変更、削除履歴をキャプチャできる機能
- 24時間以内のデータ変更履歴の保存ができ、24時間経つと消える
- Streamsでデータ更新をトリガーとしてクロスリージョンレプリケーションを実行したりするのも手
- アプリ側への通知にも使える
DynamoDB Accelerator(DAX)
- DynamoDBにインメモリ型のキャッシュ機能を付加する
- マルチAZDAXクラスターは1秒間に数百万件のリクエストを処理できる
Aurora
- 3つのAZに2つのコピーを設置可能
- 過去データはそのままS3に継続的にバックアップされる
- 99.99%高可用性、高耐久性
- リードレプリカは最大15まで
- RDS(MySQL,PostgreSQL)からAuroraへマイグレーション可能
Auroraサーバレス
- Auroraオンデマンド自動スケーリング機能
- 自動的に起動/シャットダウン
- 自動的にスケールアップ/ダウン
AuroraグローバルDB
- リードレプリカを他リージョンで構成する
- レイテンシは概ね1秒以下、最大でも5秒でレプリケーションを実行できる
EFS
- フルマネージド型サービス
- 使った分だけの従量課金
- サイズは自動で拡張縮小される
- データは複数AZに分散保存されている
- パフォーマンスモード
- 汎用モード:一般的な用途、1秒あたりファイル操作は7000まで
- 最大IOモード:何十から何百クライアントからの同時アクセス、レイテンシを犠牲にしてスループット優先
- バースト機能:一時的な性能向上
FSx
Amazon FSx For Windows File Server
-> Windowsファイルサーバのクラウド移行
SMBプロトコル対応
Amazon FSx For Lustre
-> 高速コンピューティングを実現する分散並列処理専用ストレージ
スパコンに利用されるような分散ファイルシステム
最大数百GB/sのスループット
数百万IOPSまでスケール可能
Kinesis
- Kinesis Streams:ストリームデータ処理を行うアプリ構築
- Kinesis Firehose:ストリームデータをS3やRedshiftに配信
- Kinesis Analytics:ストリームデータを標準的なSQLクエリでリアルタイム可視化、分析
この記事が気に入ったらサポートをしてみませんか?