データ アナリストは、Amazon Redshift にある一元化された販売データを使用して、Amazon QuickSight ダッシュボードを設計しています。オーストラリアのシドニーの営業担当者はオーストラリアのビューのみを表示でき、ニューヨークの営業担当者は米国 (US) のデータのみを表示できるように、ダッシュボードを制限する必要があります。
適切なデータ セキュリティを確保するために、データ アナリストは何をすべきですか?
A. オーストラリアと米国のデータ ソースを別々の SPICE 容量プールに配置します。
B. QuickSight Enterprise エディションをデプロイし、オーストラリアと米国に異なる VPC セキュリティ グループを設定します。
C. QuickSight Enterprise エディションをデプロイして、行レベル セキュリティ (RLS) を sales テーブルに実装します。
D. オーストラリアと米国の Amazon Redshift VPC セキュリティ グループをセットアップします。
正解:B
質問 2:
ある企業は、四半期財務諸表を専用の Amazon S3 バケットに保存することを計画しています。財務諸表は、S3 バケットに保存した後に変更または削除してはなりません。
これらの要件を満たすソリューションはどれですか?
A. ガバナンス モードで S3 オブジェクト ロックを使用して S3 バケットを作成します。
B. コンプライアンス モードで S3 オブジェクト ロックを使用して S3 バケットを作成します。
C. MFA 削除を有効にして S3 バケットを作成します。
D. 2 つの AWS リージョンに S3 バケットを作成します。バケット間で S3 クロスリージョン レプリケーション (CRR) を使用します。
正解:A
解説: (Pass4Test メンバーにのみ表示されます)
質問 3:
世界中に数百万人のユーザーを持つオンライン小売企業が、e コマース分析機能を改善したいと考えています。現在、クリックストリーム データは圧縮ファイルとして直接 Amazon S3 にアップロードされます。1 日に数回、Amazon EC2 で実行されるアプリケーションがデータを処理し、編集者やマーケティング担当者が視覚化できる検索オプションとレポートを作成します。同社は、ウェブサイトのクリックと集計データを編集者やマーケティング担当者が数分で利用できるようにして、ユーザーとより効果的につながることを望んでいます。
最も効率的な方法でこれらの要件を満たすのに役立つオプションはどれですか? (2つ選んでください。)
A. Kibana を使用して、Amazon Elasticsearch Service に保存されているデータを集約、フィルタリング、および視覚化します。コンテンツ パフォーマンス ダッシュボードをほぼリアルタイムで更新します。
B. クリックストリーム レコードを圧縮ファイルとして Amazon S3 にアップロードします。次に、AWS Lambda を使用して、Amazon S3 から Amazon Elasticsearch Service にデータを送信します。
C. Amazon Kinesis Data Firehose を使用して、圧縮およびバッチ化されたクリックストリーム レコードを Amazon Elasticsearch Service にアップロードします。
D. Amazon S3 から Amazon Kinesis Data Streams にクリックストリーム レコードをアップロードし、Kinesis Data Streams コンシューマーを使用してレコードを Amazon Elasticsearch Service に送信します。
E. Amazon EC2 にデプロイされた Amazon Elasticsearch Service を使用して、データを集約、フィルタリング、および処理します。コンテンツ パフォーマンス ダッシュボードをほぼリアルタイムで更新します。
正解:A,C
質問 4:
企業のマーケティング チームは、次の要件に基づいて、データの高性能な長期ストレージ サービスを特定するための支援を求めています。
データサイズは非圧縮で約32TB。
毎日、少量の単一行挿入があります。
毎日大量の集計クエリがあります。
複数の複雑な結合が実行されます。
通常、クエリには、テーブル内の列の小さなサブセットが含まれます。
最もパフォーマンスの高いソリューションを提供するストレージ サービスはどれですか?
A. Amazon Neptune
B. Amazon Elasticsearch
C. Amazon Redshift
D. Amazon Aurora MySQL
正解:C
質問 5:
動画ストリーミング Web サイトを運営している会社は、ユーザーの行動を分析してリアルタイムでユーザーに推奨事項を作成したいと考えています クリックストリーム データは Amazon Kinesis Data Streams に送信され、参照データは Amazon S3 に保存されています 同社は標準 SQL クエリを使用できるソリューションを望んでいますソリューションは、推奨事項を作成しながら、事前に計算された参照データを検索する方法も提供する必要があります。これらの要件を満たすソリューションはどれですか?
A. AWS Glue ストリーミングとスケールを使用して Kinesis Data Streams からの受信データを処理する AWS Glue コネクタを使用して Amazon Redshift にデータを書き込む
B. AWS Glue Python シェルジョブを使用して Kinesis Data Streams からの受信データを処理する Boto3 ライブラリを使用して Amazon Redshift にデータを書き込む
C. Amazon Kinesis Data Analytics を使用して、参照データに基づいてアプリケーション内テーブルを作成する Kinesis Data Streams からの受信データを処理する Amazon Kinesis Data Firehose 配信ストリームを使用して、Amazon Redshift に結果を書き込む
D. Amazon Kinesis Data Analytics を使用して、参照データに基づいてアプリケーション内テーブルを作成する Kinesis Data Streams からの受信データを処理する データストリームを使用して Amazon Redshift に結果を書き込む
正解:C
質問 6:
ある企業は履歴データを分析し、Amazon S3 に保存されているデータをクエリする必要があります。新しいデータは .csv ファイルとして毎日生成され、Amazon S3 に保存されます。同社のデータアナリストは、Amazon Athena を使用して、データ全体の最近のサブセットに対して SQL クエリを実行しています。
Amazon S3 に取り込まれるデータの量は、時間の経過とともに 5 PB まで増加しました。クエリの遅延も増加しました。会社は、スキャンされるデータの量を減らすためにデータをセグメント化する必要があります。
どのソリューションがクエリのパフォーマンスを向上させますか? (2つ選択してください。)
A. 毎日 AWS Glue ETL ジョブを実行して、データファイルを Apache Parquet 形式に変換し、変換されたファイルをパーティション分割します。定期的な AWS Glue クローラーを作成して、パーティション分割されたデータを毎日自動的にクロールします。
B. S3 ゲートウェイ エンドポイントを作成します。ゲートウェイエンドポイント経由で Amazon S3 にアクセスするように VPC ルーティングを設定します。
C. Amazon EC2 インスタンスで MySQL Workbench を使用します。JDBC コネクタを使用して Athena に接続します。Athena を直接実行するのではなく、MySQL Workbench からクエリを実行します。
D. Athena CREATE TABLE AS SELECT (CTAS) ステートメントを使用して、Apache Parquet 形式でデータ サブセットを毎日作成します。Parquet データをクエリします。
E. S3 Select を使用してデータ サブセットのファイルのみをロードするように Athena を設定します。
正解:D,E
解説: (Pass4Test メンバーにのみ表示されます)
質問 7:
企業のデータ サイエンス チームは、Windows サーバー上の共有データセット リポジトリを設計しています。データ リポジトリには、データ サイエンス チームが機械学習モデルで一般的に使用する大量のトレーニング データが保存されます。データ サイエンティストは、毎日ランダムな数の新しいデータセットを作成します。
同社は、永続的でスケーラブルなファイル ストレージと高レベルのスループットと IOPS を提供するソリューションを必要としています。また、ソリューションは可用性が高く、アクセス制御のために Active Directory と統合する必要があります。
最小限の開発労力でこれらの要件を満たすソリューションはどれですか?
A. データセットをファイルとして Amazon FSx for Windows ファイル サーバーに保存します。認証用の Active Directory ドメインを設定します。
B. データセットを Amazon DynamoDB のグローバル テーブルとして保存します。認証を Active Directory ドメインと統合するアプリケーションを構築します。
C. データセットをファイルとして Amazon EMR クラスターに保存します。認証用の Active Directory ドメインを設定します。
D. データセットをテーブルとしてマルチノード Amazon Redshift クラスターに保存します。認証用の Active Directory ドメインを設定します。
正解:A
質問 8:
ある会社は、大量の請求データ (100 MBps) を Amazon Kinesis Data Streams にストリーミングしています。データ アナリストは、account_id でデータを分割して、アカウントに属するすべてのレコードが同じ Kinesis シャードに移動し、順序が維持されるようにしました。Kinesis Java SDK を使用してカスタム コンシューマーを構築しているときに、データ アナリストは、account_id のメッセージが順不同で到着する場合があることに気付きました。さらに調査すると、データ アナリストは、順序が正しくないメッセージが同じ account_id の異なるシャードから到着しているように見え、ストリームのサイズ変更が実行されたときに見られることを発見しました。
この動作の説明と解決策は何ですか?
A. レコードのハッシュ キー生成プロセスが正しく機能していません。データ アナリストは、レコードが適切なシャードに正確に送信されるように、プロデューサー側で明示的なハッシュ キーを生成する必要があります。
B. ストリームには複数のシャードがあり、シャードで順序を維持する必要があります。データ アナリストは、ストリーム内に 1 つのシャードのみが存在し、ストリームのサイズ変更が実行されないようにする必要があります。
C. レコードが Kinesis Data Streams によって順番に受信されていません。プロデューサーは、SequenceNumberForOrdering パラメーターを指定した PutRecord API 呼び出しではなく、PutRecords API 呼び出しを使用する必要があります。
D. コンシューマーは、ストリームのサイズ変更後に子シャードを処理する前に親シャードを完全に処理していません。データ アナリストは、子シャードを処理する前に、まず親シャードを完全に処理する必要があります。
正解:D
解説: (Pass4Test メンバーにのみ表示されます)
960 お客様のコメント





Mikuni -
とても読みやすく、
解りやすく解説しています。効率的にまとまっているDAS-C01日本語版参考書だと思います。