ある機械学習スペシャリストは、クレジット カード処理会社で働いており、どの取引が不正である可能性があるかをほぼリアルタイムで予測する必要があります。具体的には、スペシャリストは、特定のトランザクションが不正である可能性を返すモデルをトレーニングする必要があります。
スペシャリストは、このビジネス上の問題をどのように組み立てるべきですか?
A. 回帰分類
B. ストリーミング分類
C. マルチカテゴリ分類
D. 二項分類
正解:D
解説: (Pass4Test メンバーにのみ表示されます)
質問 2:
データサイエンティストは、オンライン小売会社のために Amazon SageMaker でカスタム推奨モデルを構築する必要があります。同社の製品の性質上、顧客は 5 ~ 10 年ごとに 4 ~ 5 個の製品しか購入しません。そのため、同社は新しい顧客の安定した流れに依存しています。新しい顧客がサインアップすると、会社は顧客の好みに関するデータを収集します。以下は、データサイエンティストが利用できるデータのサンプルです。

データ サイエンティストは、このユース ケースのトレーニング セットとテスト セットにデータセットをどのように分割する必要がありますか?
A. ランダムに 10% のユーザーを選択します。テスト セット用に、これらのユーザーからすべてのインタラクション データを分割します。
B. すべてのインタラクション データをシャッフルします。テスト セットのインタラクション データの最後の 10% を分割します。
C. 各ユーザーの最新の 10% のインタラクションを特定します。テスト セットのこれらの相互作用を分割します。
D. インタラクション データが最も少ない 10% のユーザーを特定します。テスト セット用に、これらのユーザーからすべてのインタラクション データを分割します。
正解:A
解説: (Pass4Test メンバーにのみ表示されます)
質問 3:
機械学習チームは、Amazon SageMaker で独自のトレーニング アルゴリズムを実行します。トレーニング アルゴリズムには外部アセットが必要です。チームは、独自のアルゴリズム コードとアルゴリズム固有のパラメータの両方を Amazon SageMaker に送信する必要があります。
Amazon SageMaker でカスタムアルゴリズムを構築するために、チームはどのサービスの組み合わせを使用する必要がありますか?
(2つ選んでください。)
A. アマゾン S3
B. AWS シークレット マネージャー
C. Amazon ECS
D. Amazon ECR
E. AWS CodeStar
正解:A,D
解説: (Pass4Test メンバーにのみ表示されます)
質問 4:
データ サイエンティストは、Amazon SageMaker ノートブック インスタンスを使用して、データの調査と分析を行います。これには、Amazon SageMaker でネイティブに利用できない特定の Python パッケージをノートブック インスタンスにインストールする必要があります。
機械学習の専門家は、データ サイエンティストが使用できるように、必要なパッケージがノートブック インスタンスで自動的に利用できるようにするにはどうすればよいでしょうか?
A. 基盤となる Amazon EC2 インスタンスに AWS Systems Manager エージェントをインストールし、Systems Manager Automation を使用してパッケージ インストール コマンドを実行します。
B. Jupyter ノートブック コンソール内から conda パッケージ マネージャーを使用して、必要な conda パッケージをノートブックの既定のカーネルに適用します。
C. パッケージ インストール コマンドを使用して Amazon SageMaker ライフサイクル構成を作成し、そのライフサイクル構成をノートブック インスタンスに割り当てます。
D. 実行するパッケージ インストール コマンドを含むセルを含む Jupyter ノートブック ファイル (.ipynb) を作成し、各 Amazon SageMaker ノートブック インスタンスの /etc/init ディレクトリにファイルを配置します。
正解:C
解説: (Pass4Test メンバーにのみ表示されます)
質問 5:
機械学習スペシャリストは、トレーニングの準備としてデータを移動および変換する必要があります 一部のデータはほぼリアルタイムで処理する必要があり、その他のデータは 1 時間ごとに移動できますdata MapReduce ジョブにデータをフィードできるサービスは次のうちどれですか? (2つ選択)
A. Amazon キネシス
B. AWSDMS
C. アマゾン ES
D. アマゾン アテナ
E. AWS データ パイプライン
正解:A,E
解説: (Pass4Test メンバーにのみ表示されます)
質問 6:
データサイエンティストがAmazon SageMakerの組み込みBlazingTextアルゴリズムを用いてテキスト分類モデルを学習しています。データセットには5つのクラスがあり、カテゴリAが300サンプル、カテゴリBが292サンプルです。
カテゴリー C のサンプルは 240 件、カテゴリー D のサンプルは 258 件、カテゴリー E のサンプルは 310 件です。
データサイエンティストはデータをシャッフルし、10%をテスト用に分割します。モデルをトレーニングした後、データサイエンティストはトレーニングセットとテストセットの混同行列を生成します。
データ サイエンティストはこれらの結果からどのような結論を導き出せるでしょうか?
A. データセットが小さすぎるため、ホールドアウトクロス検証は実行できません。
B. クラス C とクラス D はあまりにも似ています。
C. データの分布が偏っています。
D. モデルはクラス B および E に対して過剰適合しています。
正解:D
解説: (Pass4Test メンバーにのみ表示されます)
1152 お客様のコメント





Makino -
MLS-C01日本語版合格いたしました。Pass4Testさんほんとうにすごい。このMLS-C01日本語版問題集で受かりそうです。