[AWS CSAP]Amazon Redshift

本稿は、AWS Solution Architect Professional に出題される Amazon Redshiftについて個人用にまとめた記事です。

Amazon Redshift が出題されるシナリオパターン

  • Redshift を複数箇所で使用したい場合、データ分析にかかる時間がそれぞれ異なる。効率よく処理するためにはどうしたらよいか。

Amazon Redshift とは

Amazon Redshift は、クラウド内のフルマネージド型、ペタバイト規模のデータウェアハウスサービスです。数百ギガバイトのデータから開始して、ペタバイト以上まで拡張できます。Amazon Redshift クラスターと呼ばれる一連のノードをプロビジョニングした後、データセットをアップロードし、データ分析クエリを実行できます。SQL ベースのツールとビジネスインテリジェンスアプリケーションを使用して、高速なクエリパフォーマンスを提供します。

ワークロード管理

Amazon Redshift のワークロード管理 (WLM) を使用すると、ユーザーは、ワークロード内の優先順位を柔軟に管理して、短くて実行速度の速いクエリが実行時間の長いクエリの後に溜まらないようにできます。

Enhanced VPC Routing ( 拡張VPCルーティング )

Amazon Redshift を拡張された VPC のルーティングを使用すると、Amazon Redshift はクラスターとデータリポジトリ間のすべての COPY と UNLOAD トラフィックが Amazon VPC を通るよう強制します。拡張VPCルーティングを使用すると、VPCセキュリティグループ、ネットワークアクセス制御リスト(ACL)、VPCエンドポイント、VPCエンドポイントポリシー、インターネットゲートウェイ、ドメインネームシステム(DNS)サーバーなどの標準VPC機能を使用できます。

これらの機能を使用して、Amazon Redshift クラスターと他のリソース間のデータの流れを厳密に管理します。拡張 VPC ルーティングを使用して VPC を介してトラフィックをルーティングする場合、 VPC フローログを使用して COPY および UNLOAD トラフィックを監視することもできます。拡張VPCルーティングが有効になっていない場合、 Amazon Redshift は、 AWS ネットワーク内の他のサービスへのトラフィックを含むインターネット経由でトラフィックをルーティングします。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA