見出し画像

Databricks(Associate)一発合格予想問題集(問題51~60)

記事単体よりもマガジンのほうがお得となります。ぜひ有料マガジンもご検討ください。



問題51


データチームがクラスタープールを利用したいと考えるシナリオを次の選択肢から選んでください。

A. データのバッチ処理を迅速に実行する必要がある。
B. データ分析の結果を安定して維持する必要がある。
C. データ分析のプロセスを詳細に監視し、最適化する必要がある。
D. 複数のデータアナリスト間でデータセットの共有と協業を行う必要がある。
E. すべてのステークホルダーがデータ分析結果を効率的にアクセスできるようにする必要がある。








解答


A. データのバッチ処理を迅速に実行する必要がある

解説


クラスタープールは、データ処理のためのリソースを効率的に管理し、処理時間を短縮するために使用されます。特に、データのバッチ処理を迅速に実行する必要がある場合、クラスタープールを利用することで、リソースの待機時間を減らし、迅速なデータ処理を実現できます。他の選択肢はクラスタープールの利用と直接関連していません:

B: 安定したデータ分析結果の維持はクラスタープールの利用とは直接関係がない。
C: データ分析プロセスの監視や最適化はクラスタープールの主な利用目的ではない。
D: データセットの共有と協業はクラスタープールとは関連性が低い。
E: すべてのステークホルダーによるデータ分析結果へのアクセスはクラスタープールの機能とは直接関連しない。
したがって、データのバッチ処理を迅速に実行する必要がある場合にクラスタープールを利用するのが適切です。




問題52


毎晩実行される複数のタスクを持つジョブがあります。各タスクは、クラスタの起動に時間がかかるため実行が遅くこまっています。ジョブで使用されるクラスタの起動時間を改善するために、データエンジニアが行うことができるアクションは以下のうちどれですか?

A. より高性能なインスタンスタイプを選択する。
B. ジョブスケジューラーを最適化する。
C. クラスタを常時稼働状態に保つ。
D. クラスタプールからのクラスタを使用する。
E. クラスタの自動スケーリングを有効にする。








解答

ここから先は

6,957字
この記事のみ ¥ 980

この記事が気に入ったらサポートをしてみませんか?