Googleデータアナリティクス認定資格【「ダーティー」なデータを「クリーン」にする】
ウィークリーチャレンジ1
1.データ完全性を担保するために必要な条件は以下のうちどれでしょうか?当てはまるものをすべて選んでください。
A 完全性
B プライバシー
C 統計的検定力
D 正確性
正解:A・D
2.データ操作にあたり、データアナリストが注意すべき点は以下のうちどれでしょうか?
A データ操作によって、データセットが読みやすくなること
B データ操作によって、エラーが発生する可能性があること
C データ操作により、データセットを異なる場所に分離すること
D データ操作によって、データセットを整理すること
正解:B
3.あるデータアナリストが、分析用のデータセットを渡されました。そのデータセットには、過去 20 年間における各国の総人口に関するデータが含まれています。その中には、過去 20 年間の各国の総人口に関するデータが含まれています。 データアナリストは、このデータに基づいて、ある国の人口が 2016 年から 2017 年にかけて増加した理由を判断できます。
この記述は正しいでしょうか、誤りでしょうか?
A 正しい
B 誤り
正解:B
4.あるデータアナリストが分析用のデータセットを渡されました。このデータセットのテンプレートを使用するには、以下のリンクからダウンロードしてください。
テンプレートのリンク: 2014 年 6 月 請求書
データアナリストは、8 行目と 9 行目のデータには考慮すべき制約事項があることに気がつきました。それは何でしょうか?
A 9 行目が 8 行目と重複している
B 9 行目には、より多くのデータが必要である
C 8 行目のフォーマットが正しくない
D 8 行目、9 行目はカレンシーを間違えている
正解:A
5.ある非営利団体で働くデータアナリストが、夏の募金活動に関するデータセットを扱っています。月末には多くの有用なデータが得られますが、彼らはそのデータが不十分であると認識しています。そこで、そのデータセットで作業を始めるのをシーズンの終わりまで待つことにしました。この例では、どのような種類の不十分なデータを説明しているでしょうか?
A 更新され続けているデータ
B 1 つのソースから得たデータ
C 古いデータ
D 地理的な制約があるデータ
正解:A
6.アンケートでデータを収集する場合、企業は母集団の 100% を調査することでコストを削減できます。 この記述は正しいでしょうか、誤りでしょうか?
A 正しい
B 誤り
正解:B
7.あるレストランでは、6 人以上で来店した顧客に試食を提供し、新しい料理に関するデータを収集しています。このシナリオは以下のうち、どれに当てはまるでしょうか?
A 地理的な制約があるサンプリング
B ランダムサンプリング
C 不偏サンプリング
D サンプリング バイアス
正解:D
8.データとビジネス上の目的の密接な整合性を確保するのに役立つプロセスは、以下のうちどれでしょうか?
A 解析中のデータの自動更新
B データ完全性の維持
C 複数回のデータ転送
D データ複製の完了
正解:B
ウィークリーチャレンジ2
1.空欄を埋めてください:条件付き書式設定とは、値が特定の条件を満たしたときに_____の表示方法を変更する、表計算ソフトの機能です。
A グラフ
B クエリ
C フィルタ
D セル
正解:D
2.データアナリストは SPLIT 関数を使用して、指定した文字をはさんだ文字列を分割し、各断片を新しい別のセルに入れました。各項目を区切る指定された文字のことを、何と呼ぶでしょうか?
A 単位
B 部分文字列
C 分割
D 区切り記号
正解:D
3.関数が正しく動作するためには、データアナリストは各関数の決められた構造に従わなければなりません。この構造を何と呼ぶでしょうか?
A 検証
B 概要
C アルゴリズム
D 構文
正解:D
4.以下のスプレッドシートで作業しているとします。
マサチューセッツ州 (MA) の Burlington の 5 桁の郵便番号を抽出するのに適した関数は、以下のうちどれでしょうか?
A =LEFT(5,B3)
B =RIGHT(5,B3)
C =LEFT(B3,5)
D =RIGHT(B3,5)
正解:D
5.人事部と一緒に働くデータアナリストが、以下のスプレッドシートで作業しています。
人事部では、D 列に社員 ID を記載したいと考えています。 ID には、入社年とマイナンバーの下 4 桁を含める必要があります。3 行目の社員の ID 20142683 を作成するには、どのような関数を使用すればよいでしょうか?
A =CONCATENATE(A3,B3)
B =CONCATENATE(A3!B3)
C =CONCATENATE(A3*B3)
D =CONCATENATE(A3+B3)
正解:A
6.あるデータアナリストが、500 行からなる新しいデータセットをクリーニングしています。セル B2 から B300 までのデータに 50 より大きい数字が含まれていないか確認する必要があります。この答えを得るには、以下のうちどの COUNTIF 関数の構文が使えるでしょうか?当てはまるものをすべて選んでください。
A =COUNTIF(B2:B300,">50")
B =COUNTIF(B2:B300,<=50)
C =COUNTIF(B2:B300,”<=50”)
D =COUNTIF(B2:B300,>50)
正解:A・B
7.VLOOKUP の「V」は何の略でしょうか?
A Visual(ビジュアル)
B Virtual(バーチャル)
C Variable(可変)
D Vertical(垂直)
正解:D
8.データアナリストは、2 つ以上のデータソースがどの程度うまく連携しているかを検証するために、データマッピングをします。 この記述は正しいでしょうか、誤りでしょうか?
A 正しい
B 誤り
正解:A
ウィークリーチャレンジ3
1.データアナリストが SQL を選ぶ理由は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。
A その分野の専門家の間ではよく知られた標準規格であるため
B 強力なソフトウェアであるため
C 膨大な量のデータを扱えるため
D Web アプリケーションも作成できるプログラミング言語であるため
正解:A・C
2.データアナリストが表計算ソフトの代わりに SQL を使用する状況は、以下のうちどれでしょうか?当てはまるものをすべて選んでください。
A データベース内の多くの異なるソースから、すばやく情報を引き出したい時
B プロジェクト全体を通してクエリや変更を記録する時
C COUNTIF 関数で特定の情報を探したい時
D 膨大な量のデータを扱う時
正解:A・B・D
3.あるデータアナリストが、小売店の顧客情報のデータベースを管理しています。データベースに新規顧客を追加するために使用できる SQL コマンドは何でしょうか?
A CREATE TABLE IF NOT EXISTS
B INSERT INTO
C DROP TABLE IF EXISTS
D UPDATE
正解:B
4.ここでは、請求書データを含むデータベーステーブルを操作しています。テーブルには、invoice_id と customer_id の列があります。顧客 ID の重複項目を削除し、請求書 ID で結果を並べ替えたいとします。
そこで、以下の SQL クエリを作成します。 DISTINCT 句を追加して、customer_id 列から重複する項目を削除しましょう。
SELECT
DISTINCT
customer_id
FROM
invoice
ORDER BY
invoice_id
クエリ結果の 12 行目に表示される顧客 ID 番号は何でしょうか?
A 42
B 23
C 16
D 8
正解:C
5.ここでは、顧客データを含むデータベーステーブルを操作しています。テーブルには、city, state, country, postal_code など、顧客の所在地に関する列が含まれています。州名は省略されており、2 文字より長い州名をチェックする必要があります。
そこで、以下の SQL クエリを作成します。 2 文字より長い州名をすべて返す LENGTH 関数を追加しましょう。
SELECT
*
FROM
customer
WHERE
LENGTH(state)>2
クエリ結果の 1 行目に表示される国はどこでしょうか?
A Chile
B India
C France
D Ireland
正解:D
6.SQL データベースにおいて、小数を含む数値を指すデータ型のことを何と呼ぶでしょうか?
A Integer
B Boolean
C String
D Float
正解:D
7.あるデータアナリストが製品の販売データを扱っています。彼らは、新しいデータをデータベースにインポートしています。 データベースは、商品価格のデータを文字列として認識しています。文字列を小数点を含む数字に変換するには、どのような SQL 関数を使用できるでしょうか?
A TRIM
B CAST
C LENGTH
D SUBSTR
正解:B
8.空欄を埋めてください:_____関数は、リスト内の非 NULL 値を返すために使用できます。
A CONCAT
B CAST
C COALESCE
D TRIM
正解:C
9.ここでは、顧客データを含むデータベーステーブルを操作しています。テーブルには、city, state, country など、従業員の所在地に関する列が含まれています。州名は省略されています。 各州の名前の最初の 2 文字を取得する必要があるため、SUBSTR 関数を使用します。さらに AS コマンドを使用して、結果を new_state という新しい列に格納します。
そこで、以下の SQL クエリを作成します。 各州名の最初の 2 文字を取得し、結果を new_state という新しい列に格納するステートメントを SQL クエリに追加しましょう。
SELECT
customer_id,
SUBSTR(state,1,2)
FROM
customer
ORDER BY
state DESC
クエリ結果の 9 行目に表示される顧客 ID 番号は何でしょうか?
A 3
B 55
C 10
D 47
正解:D
ウィークリーチャレンジ4
1.検証やレポートは、データクリーニングのプロセスの直前に行われます。 この記述は正しいでしょうか、誤りでしょうか?
A 正しい
B 誤り
正解:B
2.あるデータアナリストが検証の段階に入り、データ分析プロジェクトに関するビジネス上の課題、目標、そしてデータを確認しています。これはどのようなシナリオを指しているでしょうか?
A データのレポート作成
B ステークホルダーヘの配慮
C 全体像の把握
D データの可視化
正解:C
3.空欄に当てはまるものをすべて選んでください:TRIM は、データ中の_____のスペースを削除する関数です。
A 繰り返し
B 内部
C 末尾
D 先頭
正解:A・C・D
4.同一のエラーがデータセットにいくつ発生しているか把握するために、データアナリストが活用できる関数は何でしょうか?
A COUNTA
B CONFIRM
C CASE
D COUNT
正解:A
5.1 つまたは複数の条件を満たす値を返す SQL のツールは以下のうちどれでしょうか?
A ELSE
B WHEN
C CASE
D THEN
正解:C
6.あるデータアナリストが、データのクリーニングを行うさいに変更ログを使用しています。変更ログとはどのような作業をするものでしょうか?
A イルミネーション
B 文書化
C 情報開示
D 審査
正解:B
7.空欄を埋めてください:データアナリストは、データクリーニングのさいに行った変更を、変更ログに時系列で記録します。変更ログは、_____の間にエラーや疑問が出てきた場合に参照できます。
A ビジュアライゼーション
B 検証
C プレゼンテーション
D 文書化
正解:B
8.あるデータアナリストが、クエリを新しく改良したクエリとしてリポジトリに書き込み、行った変更とその理由を指定しています。このシナリオは、どのようなプロセスの一部でしょうか?
A 変更ログの作成
B データの可視化
C ステークホルダーとのコミュニケーション
D データのレポート
正解:A
コースチャレンジ
合格するには80% 以上
ここから先は
¥ 300
この記事が気に入ったらサポートをしてみませんか?