《練習問題》 2024#5対策
次回、2024年9月7日(土)の試験に向けた問題集となっております。
なお2024#4の試験で既に新シラバス(G2024#6から適用とありますが)からも出題されていたため、新シラバスの章に合わせて作成しております。
本番の試験同様、選択肢1~4からの選択方式にしてあります。
なお、正解については検証を行ったうえで付しておりますが、公開されていないため100%正確とは言い切れない点はご了承ください。
模範解答のみで解説は記載しておりませんので、試験直前の理解度チェックのためにお使いいただくのが良いと思います。
【技術分野】
1章 人工知能とは
【問1】
AI効果の説明として、最も適切な選択肢を一つ選べ。
AIの活用により、加速度的に人間社会が発展すること。
AIの活用により、人間が持っていた能力が衰えてしまうこと。
それまでAIとされてきた技術が、仕組みが理解されるようになり、AIとして認識されなくなること。
AIを活用することにより、日常の様々な活動が自動化されること。
正解:3
【問2】
知識獲得のボトルネックと呼ばれる問題の説明として、最も適切な選択肢を一つ選べ。
AIが現実世界で起こりうる全ての可能性を考慮して行動しようとすると、目的と関係のない行動まで無数に考慮するため、処理しきれず動けなくなってしまう問題
データを大量に用意しても、コンピュータの処理能力には限界があるため、すべてのデータを処理するには膨大な時間がかかるという問題
人間らしい応答をするチャットボットが、本当に言葉の意味を理解しているか分からないという問題
道徳や物理法則など、タスクを解くために必要なさまざまな常識をコンピュータに教えることは難しいという問題
正解:4
【問3】
知識獲得のボトルネックに関する記述として、最も不適切な選択肢を一つ選べ。
一般常識まで含めた広い範囲の知識まで含めると膨大な量のルールが必要となる。
専門家から膨大な量の専門知識をヒアリングして整理することに多大な労力がかかる。
暗黙知のように、専門家が勘や経験で判断している事柄を明文化することは難しい。
知識データは膨大となるため、それを保存するための演算処理能力が不足してしまう。
正解:4
【問4】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
人工知能は有限の処理能力しかないため、現実に起こりうる問題すべてに対処することができない( )がある。
最適化問題
ブラックボックス問題
シンボルグラウンディング問題
フレーム問題
正解:4
2章 人工知能をめぐる動向
【問5】
プランニングにおいて、前提条件・行動・結果という3つの組み合わせで記述する方法として、最も適切な選択肢を一つ選べ。
エニアック(ENIAC)
SHRDLU
マイシン(MYCIN)
STRIPS
正解:4
【問6】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
第1次AIブームは1950年代に起こった。この頃に人工知能と呼ばれたプログラムは( )をもとに問題を解いていた。
探索・推論
表現学習
機械学習
知識表現
正解:1
【問7】
深さ優先探索に関する記述として、最も不適切な選択肢を一つ選べ。
一般的に、幅優先探索よりも解発見までのメモリ使用量が少なくなる。
必ずしも最短経路が最初に見つかるとは限らない。
子の無いノードに行き着くまで階層を深く探索し、目的のノードが見つからなければ戻る。
キューを用いて、先入れ先出し方式で探索を進めていく。
正解:4
【問8】
以下の文章を読み、空欄(A)~(C)に最もよく当てはまる選択肢を一つ選べ。
Mini-Max法は、将棋・チェスなどのゲームにおいて、自分が指すときにスコアが(A)になるように、また、相手が指す時にはスコアが(B)になるように決定を行う戦略のことである。
さらに、Mini-Max法を用いた探索を削減する手法として、(C)がある。
(A)最小
(B)最大
(C)モンテカルロ法(A)最小
(B)最大
(C)αβ法(A)最大
(B)最小
(C)モンテカルロ法(A)最大
(B)最小
(C)αβ法
正解:4
【問9】
木構造で表現可能なデータを探索する手法は、複数存在する。
対象とする木構造が複雑、かつ、使用可能なメモリが限られている場合に適した探索手法として、最も適切な選択肢を一つ選べ。
ヒューリスティック探索
幅優先探索
二分探索
深さ優先探索
正解:4
【問10】
1980年代に普及した、専門家の知識を取り込んだ人工知能システムとして、最も適切な選択肢を一つ選べ。
コーパス
トイ・プロブレム
ブルートフォース
エキスパートシステム
正解:4
【問11】
意味ネットワークにおける「is-aの関係」として、最も不適切な選択肢を一つ選べ。
両生類 ⇒ 生物
人間 ⇒ 哺乳類
犬 ⇒ 哺乳類
動物 ⇒ 哺乳類
正解:4
【問12】
意味ネットワークの説明として、最も不適切な選択肢を一つ選べ。
「概念」をノードで表し、概念間の関係をリンクで結んだネットワークである。
「is-a」の関係は、継承関係を表している。
「part-of」の関係は、属性を表している。
ネットワークが複雑で人間にとっては分かりづらく、知識の検索も困難である。
正解:3
【問13】
ビッグデータについて述べたものとして、最も不適切な選択肢を一つ選べ。
ビッグデータは特定の構造を持たず、さまざまな種類や形式を含む非構造化データとなりうる。
ディープラーニングの学習に大量のデータが必要となるので、ビッグデータはAIの進歩に重要な役割を担っている。
IoTに対応したデバイスで、センサーにより取得されたデータがビッグデータとして活用されている。
ビッグデータはデータの量が膨大であるため、偏りがほとんど見られず高品質である。
正解:4
【問14】
ビッグデータは、3つのVで表される特徴を持つ。
3つの特徴として最も不適切な選択肢を一つ選べ。
Variety(データの多様性がある)
Volume(データ量が大きい)
Velocity(データの生成速度 / 更新頻度が速い / 高い)
Vague(データの漠然性が高い)
正解:4
【問15】
以下の文章を読み、(A) (B)に最もよく当てはまる選択肢を1つ選べ。
機械学習の分野においては「次元の呪い」と呼ばれる課題に直面しやすい。
(A)どのような場面に直面しやすいか
(B)どのような課題を引き起こすか
(A)データの次元の高さに対して訓練事例が多い場合 (B)学習にかかる時間が短くなる。
(A)データの次元の高さに対して訓練事例が多い場合 (B)汎化性能が悪化する。
(A)データの次元の高さに対して訓練事例が少ない場合 (B)学習にかかる時間が長くなる。
(A)データの次元に対して訓練事例が少ない場面 (B)汎化性能が悪化する。
正解:4
【問16】
機械学習を進める際に次元の呪いが問題となることがある。この現象についての説明として、最も適切な選択肢を一つ選べ。
隠れ層を遡るごとに、伝播していく誤差が小さくなり、学習が進まなくなることである。
学習するモデルが訓練データに過度に適合してしまい、予測性能が逆に低下してしまうことである。
正則化を行いすぎることなどにより、モデルが訓練データに適合しなくなることである。
入力する変数の個数が増えると、決めるべきパラメータ数が指数関数的に増加することである。
正解:4
【問17】
統計的機械翻訳についての説明として、最も適切な選択肢を一つ選べ。
事前に収集した対訳集を基に構築したモデルを用いる。
翻訳システム構築には各言語の文法を理解する必要がある。
用意された対訳データが少量であっても、十分な品質な翻訳システムを構築しやすい。
登録済みのルールから原文を分析し、訳文を出力する。
正解:1
【問18】
2010年から2017年まで世界的に実施された画像認識の精度を競うコンペティションの名称として、最も適切な選択肢を一つ選べ。
ICCV
ECCV
CVPR
ILSVRC
正解:4
3章 機械学習の概要
【問19】
ベクトル自己回帰モデル(VARモデル)はどのようなモデルか、最も適切な選択肢を一つ選べ。
単変量時系列データを分析するためのモデル
ランダムウォークモデル
多変量時系列データを分析するためのモデル
多次元空間においてデータをクラスタリングするためのモデル
正解:3
【問20】
多クラス分類において、ニューラルネットワークの出力層によく用いられる活性化関数として、最も適切な選択肢を一つ選べ。
ソフトマックス関数
恒等関数
Leaky ReLU関数
tanh関数
正解:1
【問21】
教師あり学習において、モデルの出力と正解ラベルの誤差を表現する関数として、最も適切な選択肢を一つ選べ。
損失関数
価値関数
活性化関数
尤度関数
正解:1
【問22】
カーネル関数の説明として、最も適切な選択肢を一つ選べ。
カーネルトリックは、線形分類よりも非線形分類が可能な機械学習モデルにおいて、有効な手法である。
画像認識では、データが高次元すぎるため、カーネルトリックを使えない。
カーネルトリックでは、カーネル関数によってデータを低次元に写像することで、線形分類しやすくする。
サポートベクターマシン(SVM)などで線形分類を行う場合、分類対象のデータをカーネル関数によって高次元に写像する。そして、その際にカーネルトリックが有効である。
正解:4
【問23】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
時系列データにおいては、(A)と呼ばれる手法が広く利用される。これは、例えば次の式のようにある時点のデータと過去のデータとの関係性をモデル化するものである。ただし、式中のXtなどは時系列データ、Wtなどはパラメータ、cは定数、εはノイズをそれぞれ表す。
特に(B)ものは、ベクトル(A)モデルと呼ばれる。
(A)自己符号化
(B)入力・出力ともにベクトルである(A)自己回帰
(B)入力・出力ともにベクトルである(A)自己符号化
(B)入力のみがベクトルで出力はスカラー(1次元)である(A)自己回帰
(B)入力のみがベクトルで出力はスカラー(1次元)である
正解:2
【問24】
次の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
機械学習では、精度の高いモデルを作る工夫として、複数のモデルを組み合わせる方法が用いられる。
決定木を例にすると、(A)は複数の決定木を直列に用意する方法で、各決定木は直前の決定木が誤認したデータを正しく認識するように学習する。
(A)において各モデルの最適化に勾配降下法を用いたものを(B)という。
(A)ブートストラップ(B)AdaBoost
(A)ランダムフォレスト(B)バギング
(A)アンサンブル学習(B)確率的勾配降下法
(A)ブースティング(B)勾配ブースティング"
正解:4
【問25】
アンサンブル学習は、Kaggle等のコンペティションでも多く使われるテクニックの1つである。アンサンブル学習のメリットとして、最も適切な選択肢を一つ選べ。
計算リソースが十分でない企業等でも活用できる。
学習時間を削減できる。
モデルの精度やロバスト性を向上させることができる。
推論速度を向上させることができる。
正解:3
【問26】
アンサンブル学習を行っているとはみなされないモデル・手法として、最も適切な選択肢を1つ選べ。
サポートベクターマシン(SVM)
ランダムフォレスト
ドロップアウト
勾配ブースティング
正解:1
【問27】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
線形分離可能でないデータをサポートベクターマシン(SVM)で扱う場合、(A)によって分離可能にすることができる。この時、計算効率を上げるためのテクニックとして(B)がある。
(A)高次元空間に写像すること
(B)カーネルトリック(A)データを標準化すること
(B)誤差逆伝播法(A)高次元空間に写像すること
(B)データの標準化(A)データを標準化すること
(B)カーネルトリック
正解:1
【問28】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
レコメンデーションの手法の一つに、(A)商品を推薦する協調フィルタリングがある。協調フィルタリングには(B)というコールドスタート問題が存在する。
(A)自身が買った商品と特徴が似ている
(B)システムの起動や推薦の処理に時間がかかってしまう(A)似ているユーザが買っている
(B)システムの起動や推薦の処理に時間がかかってしまう(A)自身が買った商品と特徴が似ている
(B)参考にできるデータが集まるまで推薦を行うことができない(A)似ているユーザが買っている
(B)参考にできるデータが集まるまで推薦を行うことができない
正解:4
【問29】
ECサイト等でのレコメンド機能で、利用が初めての顧客に対して効果的な提案が出来ない現象について、最も適切な選択肢を一つ選べ。
フレーム問題
フィルターバブル
最適化問題
コールドスタート問題
正解:4
【問30】
潜在的ディリクレ配分法(LDA)についての説明として、最も適切な選択肢を一つ選べ。
データの相関を分析することで、データの構造を掴む手法である。
クラスタリングの1手法であり、各データがそれぞれ1つの階層構造を有するクラスタリングに分類される。
クラスタリングの1手法であり、各データがそれぞれ1つ以上のクラスタに分類される。
クラスタリングの1手法であり、各データが階層構造をもたない1つのクラスタに分類される。
正解:3
【問31】
次元圧縮や高次元データの可視化を目的としたアルゴリズムとして、最も不適切な選択肢を一つ選べ。
k-means法
多次元尺度構成法
t-SNE
主成分分析(PCA)
正解:1
【問32】
ウォード法に関する説明として、最も適切な選択肢を一つ選べ。
群平均法の別称である。
最短距離法と比較して分類感度が低い。
他の階層型手法より計算量が少ない。
クラスタ内の分散に着目したクラスタリング手法である。
正解:4
【問33】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
ε-greedy法は、最も報酬の期待値が高い行動を選択するが、一定の確率で( )行動を選択する強化学習のアルゴリズムである。
1つ前の行動と同じ
報酬が低い
これまでに選択した回数が少ない
ランダムに
正解:4
【問34】
強化学習において、価値関数ベースと方策勾配ベースの考え方を組み合わせた手法として、最も適切な選択肢を一つ選べ。
REINFORCE
Q学習
SARSA
Actor-Critic
正解:4
【問35】
強化学習における行動価値関数Qの説明として、最も適切な選択肢を一つ選べ。
行動価値関数Qとは、状態と行動を引数としてそのときの反省を返す関数である。
行動価値関数Qとは、状態と行動を引数としてそのときの効用値を返す関数である。
行動価値関数Qとは、行動と価値を引数としてそのときの反省を返す関数である。
行動価値関数Qとは、行動と価値を引数としてそのときの効用値を返す関数である。
正解:2
【問36】
がん診断を行うAIモデルを仮定する。ここで「ガンである人をガンでないと誤診断する」ことはもっとも避けたいことである。
これを評価する上で用いるべき評価指標として、最も適切な選択肢を一つ選べ。
正解率
適合率
再現率
F値
正解:3
【問37】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
陽性と陰性の2クラス分類の予測結果を表現する混同行列において、実際に陽性であるサンプルのうち、陽性と正しく予測されたサンプルの割合を( )と呼ぶ。
割引率
正解率
適合率
再現率
正解:4
【問38】
AIモデルでがん患者かどうか識別する際に、リスクの観点から、最も重要と考えられるモデルの評価指標と、その理由の組み合わせとして、最も適切な選択肢を一つ選べ。
偽陽性:癌であるにも関わらず、癌でないと判断される割合であるから。
偽陽性:癌でないにも関わらず、癌であると判断される割合であるから。
偽陰性:癌でないにも関わらず、癌であると判断される割合であるから。
偽陰性:癌であるにも関わらず、癌でないと判断される割合であるから。
正解:4
【問39】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
閾値を0から1に変化させていった場合に、予測の当たり外れがどのように変化していくのかを表したものが(A)となる。
(A)より下部の面積のことを(B)と呼び、(B)が1に近いほどモデル性能が高いことを表す。
(A)AIC
(B)ROC曲線(A)AUC
(B)ROC曲線(A)ROC曲線
(B)AIC(A)ROC曲線
(B)AUC
正解:4
【問40】
以下の文章を読み、空欄(A)~(C)に最もよく当てはまる選択肢を一つ選べ。
一般に機械学習においては(A)が小さいモデルほど良いとされる。
訓練誤差が大きい状態を(B)といい、訓練誤差が小さく、汎化誤差が大きい状態を(C)という。
(A)訓練誤差
(B)過学習
(C)未学習(A)汎化誤差
(B)過学習
(C)未学習(A)訓練誤差
(B)未学習
(C)過学習(A)汎化誤差
(B)未学習
(C)過学習"
正解:4
【問41】
ディープラーニングを利用した学習時に過学習を防ぐ、もしくは抑制するために使用される手法として、最も不適切な選択肢を一つ選べ。
バッチ学習
早期終了
正則化
ドロップアウト
正解:1
4章 ディープラーニングの概要
【問42】
計算機において、メモリ内のデータやプログラムを解釈して適する動作を実行する装置の名称として、最も適切な選択肢を一つ選べ。
CUI
RAM
ROM
CPU
正解:4
【問43】
多層パーセプトロンの説明として、最も適切な選択肢を一つ選べ。
多層パーセプトロンは、再帰型ニューラルネットワークの1種である。
多層パーセプトロンは、エコーステートネットワークの1種である。
多層パーセプトロンは、回帰型ニューラルネットワークの1種である。
多層パーセプトロンは、順伝播型ニューラルネットワークの1種である。
正解:4
【問44】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
多層パーセプトロンは単純パーセプトロンに1つ以上の(A)を増やしたもので、誤差逆伝播法を用いた場合に、活性化関数の選択が適切でないと誤差のフィードバックが上手くいかなくなる(B)という問題が生じるようになった。
(A)隠れ層
(B)勾配消失問題(A)入力層
(B)勾配消失問題(A)隠れ層
(B)信用割当問題(A)入力層
(B)信用割当問題
正解:1
【問45】
文章をよく読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
活性化関数として一般的に用いられる関数の1つとしてReLU関数がある。
これは、入力をx、出力をyで表したとき、x>0においては傾きは(A)、x<0においては傾きが(B)となる。
(A)1
(B)-1(A)x
(B)-1(A)1
(B)0(A)x
(B)0
正解:3
【問46】
ニューラルネットワークにおけるソフトマックス関数についての説明として、最も不適切な選択肢を一つ選べ。
分類問題でよく用いられる。
出力値の和が1.0になるように変換する。
ロジスティック関数を多次元に拡張したものである。
中間層の活性化関数としてよく用いられる。
正解:4
【問47】
Leaky ReLU関数の特徴についての説明として、最も不適切な選択肢を一つ選べ。
X<0の範囲で0の値をとる。
活性化関数にシグモイド関数を使う場合と比較して、計算が単純で処理が早い。
X>0で線形である。
活性化関数にシグモイド関数を使う場合と比較して、勾配消失問題の抑制が期待できる。
正解:1
【問48】
Leaky ReLU関数に関する説明として、最も適切な選択肢を一つ選べ。
入力が正の場合でも負の場合でも、傾きは1となり、勾配消失問題が生じない。
入力値が負の場合に、傾きを0とするReLU関数であり、勾配爆発問題の発生を減少させることができる。
入力値が負の場合に、傾きは1となり、勾配消失問題が生じない。
入力値が負の場合に、微小な傾きを持つReLU関数の派生であり、勾配消失問題の発生を減少させることができる。
正解:4
【問49】
以下の(A)、(B)、(C)はディープラーニングでよく使われる活性化関数を微分したグラフである。
各グラフは、どの関数を微分したものか、最も適切な選択肢を一つ選べ。
(A)シグモイド関数
(B)ReLU関数
(C)Leaky ReLU関数(A)シグモイド関数
(B)Leaky ReLU関数
(C)ReLU関数(A)tanh関数
(B)ReLU関数
(C)Leaky ReLU関数(A)tanh関数
(B)Leaky ReLU関数
(C)ReLU関数
正解:4
【問50】
活性化関数にシグモイド関数を利用していたら、勾配消失が起こった。このとき、勾配消失を起こさないようにするために、シグモイド関数に代わる活性化関数として、最も適切な選択肢を一つ選べ。
ステップ関数
ReLU関数
ソフトマックス関数
tanh関数
正解:2
【問51】
ニューラルネットワークの学習において、ドロップアウトが持つ効果として、最も適切な選択肢を一つ選べ。
パラメータ間の値のばらつきが小さくなる。
パラメータが減りメモリ効率が良くなる。
全体的な学習の速度が向上する。
学習データへの過剰適合を防ぐ。
正解:4
【問52】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
機械学習の過学習を防ぐ方法として正則化がある。
正則化を採用した回帰分析手法には、「自動的に特徴選択を行い、重要でないと判断された特徴量を自動的にモデルから消す」効果がある(A)と、「パラメータの大きさに応じてゼロに近づけることで、汎化された滑らかなモデルを得る」効果がある(B)がある。
(A)ロジスティック回帰
(B)自己回帰(A)リッジ回帰
(B)ラッソ回帰(A)自己回帰
(B)ロジスティック回帰(A)ラッソ回帰
(B)リッジ回帰
正解:4
【問53】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
正則化を行う方法として、リッジ回帰・ラッソ回帰などがある。
このうち(A)はL1正則化を指し、もう一方はL2正則化を指す。
(B)は他方と比較してパラメータが0になりやすい(スパースなモデルになりやすい)という特徴がある。
(A)ラッソ回帰
(B)ラッソ回帰(A)リッジ回帰
(B)ラッソ回帰(A)ラッソ回帰
(B)リッジ回帰(A)リッジ回帰
(B)リッジ回帰
正解:2
【問54】
誤差逆伝播法に関する記述として、最も不適切な選択肢を一つ選べ。
まずは入力層から出力層まで順伝播計算を行い、予測値と正解ラベルとの誤差を計算する。
出力層から入力層へ向かって誤差を逆伝播していく手法である。
学習率に応じて重みやバイアスを更新して行く。
数学的には合成関数の積分が深く関与している。
正解:4
【問55】
PBTTに関する説明として、最も不適切な選択肢を一つ選べ。
大きな時系列データを扱う場合にはコンピュータの計算リソースや勾配消失などに注意を払う必要がある。
通常の誤差逆伝播法と同様に、ニューラルネットワークの重みに関する学習を実施することができる。
LSTMとの親和性が高い手法であり、GRUに対して適用することはない。
時間方向に展開したニューラルネットワークの誤差逆伝播法であり、RNNの学習時などに利用される。
正解:3
【問56】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
信用割当問題とは、ニューラルネットワーク内のどのパラメータが出力層での正解に貢献しているのか、誤差を生じさせているのかを求める問題である。この信用割当問題は、( )の登場によって解決された。
ドロップアウト
多層パーセプトロン
オートエンコーダ
誤差逆伝播法
正解:4
【問57】オンライン学習についての説明として、最も適切な選択肢を一つ選べ。
行動価値関数を最適化するよう学習を進めることである。
訓練データを一度に与えてモデルの学習を行うことである。
複数のモデルを基礎としてモデルを構築することである。
訓練データを1つずつ与えてモデルの学習を行うことである。
正解:4
【問58】
ニューラルネットワークの学習に必要なデータ数の目安となる経験則「バーニーおじさんのルール」の説明として、最も適切な選択肢を一つ選べ。
モデルのパラメータ数と同数のデータ数が必要である。
データ数は問題の複雑さに依存するが、問題の複雑さを定義できないため、データ数も定まらない。
モデルのパラメータ数の100倍のデータ数が必要である。
モデルのパラメータ数の10倍のデータ数が必要である。
正解:4
【問59】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
ミニバッチ学習法においては、ミニバッチと呼ばれるデータのサブセットごとにネットワークの重みの更新が行われる。
その更新が1回行われることを(A)といい、各ミニバッチの更新が一巡すること(全てのデータが更新に利用されること)を(B)という。
(A)ジェネレーション
(B)バッチ(A)イテレーション
(B)バッチ(A)ジェネレーション
(B)エポック(A)イテレーション
(B)エポック
正解:4
【問60】
バッチ学習とミニバッチ学習のメモリ使用量について、最も適切な選択肢を一つ選べ。
メモリ使用量はバッチ学習とミニバッチ学習とは無関係である。
ミニバッチ学習の方がメモリ使用量が大きい。
バッチ学習とミニバッチ学習のメモリ使用量は同じである。
バッチ学習の方がメモリ使用量が大きい。
正解:4
【問61】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
( )は、勾配降下法において用いられる最適化アルゴリズムの1つである。直近の複数回について重みの更新幅の移動平均を計算し、それに基づいて次の更新時の学習率の大きさを調節する。
RMSProp
AdaGrad
AdaBoost
モーメンタム
正解:1
【問62】
学習率に関する説明として、最も不適切な選択肢を一つ選べ。
学習率の値を大きくしすぎると収束しない。
一般に学習率の値が低すぎると収束するための時間が延びる。
学習率の値を適切な範囲で大きく設定することで学習が早く進む。
学習率を変えたとしても収束に要する繰り返し回数に変化はない。
正解:4
【問63】
ニューラルネットワークの最適化において、重みを調整する際に、調整量に慣性を加えることでより効率的に収束させた最適化手法を何と呼ぶか、最も適切な選択肢を一つ選べ。
最急降下法
モーメンタム
AdaGrad
確率的勾配降下法(SGD)
正解:2
【問64】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
ミニバッチ学習では、学習に用いるデータを複数のグループに分割し、各グループごとに重みを更新する。
ミニバッチのサイズを大きくすると、ミニバッチ間での勾配のばらつきが(A)なる傾向があり、重みの更新がより安定になることから、学習率をより(B)設定できる。
(A)大きく
(B)小さく(A)小さく
(B)小さく(A)大きく
(B)大きく(A)小さく
(B)大きく
正解:4
【問65】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
米国の物理学者 David H.WolpertとWilliam G.Macreadyが提唱した「あらゆる問題で性能の良い汎用的な最適化戦略は理論上不可能である」とする定理を( )と呼ぶ。
次元の呪い
ノーフリーランチ定理
みにくいアヒルの子の定理
バーニーおじさんのルール
正解:2
【問66】
多層パーセプトロンにおいて、ハイパーパラメータに該当する最も適切な選択肢を一つ選べ。
入力層の重み
学習率
出力層の重み
バイアス項
正解:2
【問67】
ニューラルネットワークの過学習を回避するための手法の1つである早期終了として、最も適切な選択肢を一つ選べ。
ミニバッチごとに教師データに対して正規化を行う。
中間層における活性化関数としてReLU関数やLeaky ReLU関数を用いる。
教師データを学習する際に、ランダムに選択されたニューロンを除外する。
学習途中でエポックごとに検証データに対する誤差を評価し、増加した時点で学習を止める。
正解:4
5章 ディープラーニングの要素技術
【問68】
畳み込みニューラルネットワーク(CNN)において、パディングの効果の説明として、最も適切な選択肢を一つ選べ。
出力サイズを調整することができる。
データの特定範囲の特徴を抽出する。
特徴マップを小さくする。
移動不変性を強化する。
正解:1
【問69】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
畳み込みニューラルネットワーク(CNN)の畳み込み層では、( )を画像に重ねてデータの積和を算出しながらスライドさせ、特徴マップを抽出する。( )はカーネルとも呼ばれる。
アテンション
バウンディングボックス
インスタンスセグメンテーション
フィルタ
正解:4
【問70】
ディープニューラルネットワーク(DNN)を学習・推論するとき、入力前のデータではなくネットワークの各層でデータの偏りを調整する手法の1種として、最も適切な選択肢を一つ選べ。
バッチ平坦化
バッチ初期化
バッチ可視化
バッチ正規化
正解:4
【問71】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
畳み込みニューラルネットワーク(CNN)の出力層で、全結合層に代わって( )が用いられるようになった結果、出力結果と特徴マップとの関連が強くなることでこれまでよりも解釈しやすくなった。
サブサンプリング層
最大値プーリング
平均値プーリング
グローバルアベレージプーリング(GAP)
正解:4
【問72】
双方向リカレントニューラルネットワークの説明として、最も適切な選択肢を一つ選べ。
尚、入力される系列データにおいて、t=1を最初の時刻、t=Txを最終の時刻とする。
t=1からt=Txへ2回走査する。
t=1からt=Txの走査に加えて、逆順のt=Txからt=1の走査も加える。
パラメータ更新の順序の問題であるため、入力データに関してはt=1からt=Txの走査をする。
t=Txからt=1へ走査する。
正解:2
【問73】
時系列データについて述べたものとして、最も不適切な選択肢を一つ選べ。
音声データは音素ごとに特定の波形を持つため、一般的に時系列データとしては扱わない。
時系列データを用いて適切な予測を行うためには、使用するネットワークに時間情報を反映させる仕組みが必要である。
ある時刻の状態が、それ以前の時刻の状態の影響を受けているものは、時系列データに含まれる。
自然言語処理など時系列データを用いた学習では、リカレントニューラルネットワーク(RNN)が使われることがある。
正解:1
【問74】
ポアソン回帰によるモデル分析の対象例として、最も適切な選択肢を一つ選べ。
桜の開花日
月平均雨量の年推移
さいころの出目
航空機事故の発生件数
正解:4
【問75】
リカレントニューラルネットワーク(RNN)の1種であるGRUに含まれるゲートの説明として、最も適切な選択肢を一つ選べ。
各ゲートの値をもとに出力層に与えるメモリセルの値を調整する。
各ゲートには活性化関数を用いない。
各ゲートの値をもとにメモリセルに与える値を調整する。
各ゲートにはシグモイド関数などの活性化関数が用いられる。
正解:4
【問76】
LSTMについて述べたものとして、最も適切な選択肢を一つ選べ。
リカレントニューラルネットワーク(RNN)を過去から未来の方向へ学習するだけでなく、未来から過去方向も含めて学習できるようにした手法である。
記憶セル、入力ゲート、出力ゲート、および忘却ゲートから構成されるニューラルネットワークである。
エンコーダとデコーダで構成され、エンコーダが入力データを処理して符号化し、符号化された入力情報を使ってデコーダが復号化する。
畳み込み層とプーリング層をもつニューラルネットワークである。
正解:2
【問77】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
LSTMは入力ゲート・出力ゲート・忘却ゲートの他、(A)と呼ばれるセル構造をもつ。その役割は(B)である。
(A)CTC
(B)出力重み衝突・入力重み衝突を防ぐこと(A)CEC
(B)出力重み衝突・入力重み衝突を防ぐこと(A)CTC
(B)誤差を内部にとどめ、勾配消失を防ぐこと(A)CEC
(B)誤差を内部にとどめ、勾配消失を防ぐこと
正解:4
【問78】
リカレントニューラルネットワーク(RNN)の1種であるGRUに含まれるリセットゲートの説明として、最も適切な選択肢を一つ選べ。
メモリセルの長期記憶に新たな情報を追加する割合を求める。
新たに記憶する割合を調整し、長期記憶の更新割合となる重みを求める。
メモリセルの長期記憶から忘却する割合を求める。
前時刻の値からどれだけ忘却するかを調整する重みを求める。
正解:4
【問79】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
リカレントニューラルネットワーク(RNN)において、時系列データを扱う際には、ディープニューラルネットワーク(DNN)において問題となる勾配消失問題の他、出力重み衝突・入力重み衝突などの問題が生じた。
これらに対応するため、ゲート機構を備えるネットワーク、LSTMと(A)が考案された。
LSTMは入力ゲート・忘却ゲート・出力ゲートの3種のゲートと(B)と呼ばれるセルを含む構造になっている。
また、(A)は(B)を持たず、ゲートとしてリセットゲートと更新ゲートを備える。
(A)GLUE
(B)CTC(A)GRU
(B)CTC(A)GLUE
(B)CEC(A)GRU
(B)CEC
正解:4
【問80】
LSTMの計算効率を向上させるために、ゲート機構を簡略化した手法の名称として、最も適切な選択肢を一つ選べ。
GPU
CNN
DQN
GRU
正解:4
【問81】
LSTMの説明として、最も不適切な選択肢を一つ選べ。
入力ゲート・忘却ゲート・出力ゲート・セルで構成されるLSTMブロックを導入している。
LSTMブロックを利用しないリカレントニューラルネットワーク(RNN)と比較して勾配消失問題が起きにくい。
隠れ層に過去のデータを保持し、必要なタイミングで取得できるように工夫されている。
LSTMブロックを利用しないリカレントニューラルネットワーク(RNN)と比較して計算量が少ない。
正解:4
【問82】
Attentionとは、queryとkeyと呼ばれる行列を用いて、valueの重要度を計算して重み付けを行う手法である。Attentionに関する以下の文章を読み、空欄(A)~(C)に最もよく当てはまる選択肢を一つ選べ。
(A)とは、queryとmemory(keyとvalueの変換元)を同じ文章から生成する手法で、Transformerモデルに用いられている。
(B)とは、queryとmemory(keyとvalueの変換元)をそれぞれ別の文章から生成する手法で、(C)に応用される。
(A)Source-Target Attention
(B)Self-Attention
(C)質問応答システム(A)Source-Target Attention
(B)Self-Attention
(C)文章分類(A)Self-Attention
(B)Source-Target Attention
(C)質問応答システム(A)Self-Attention
(B)Source-Target Attention
(C)文章分類
正解:3
【問83】
Self-Attentionに関する説明として、最も不適切な選択肢を1つ選べ。
入力文内または出力文内の単語間の関連図を計算したものである。
文内のある単語に関する計算は、他の単語に関する計算とは独立しているので、すべての計算が並列に行える。
文内で遠い位置にある単語同士の関係を捉えることが難しい。
Self-Attentionを用いることで、その文における文脈を考慮したより、適切な表現を得ることができる。
正解:3
【問84】
Attentionについて述べたものとして、最も不適切な選択肢を一つ選べ。
SENetにおいても活用され、特徴マップの重み付けに利用される。
2017年に発表されたTransformerにおいて利用されている。
LSTMにはAttention機構が含まれているため、従来のリカレントニューラルネットワーク(RNN)と比較して勾配消失問題が起きにくい。
特定の出力を行う際に、どの入力がどの程度重要かの重み付けを行う。
正解:3
【問85】
変分オートエンコーダ(VAE)の説明として、最も不適切な選択肢を一つ選べ。
入力画像を統計分布のパラメータ(平均と分散)に変換する。
オートエンコーダと同様に入力と出力が同じになるような学習を行う。
ジェネレータとディスクリミネータによって学習される。
損失関数にはKLダイバージェンスが使われる。
正解:3
【問86】
以下の文章を読み、空欄(A)~(D)に最もよく当てはまる選択肢を一つ選べ。
(A)は、データに対するクラスの条件付き確率(事後確率)をモデル化したものである。
一方で(B)は、クラスに対するデータの条件付き分布をモデル化したものである。(B)の代表的なモデル例として、オートエンコーダや変分オートエンコーダ(VAE)がある。
オートエンコーダは、中間層のノード数を入力層や出力層より小さくし、元の画像を復元するように学習させることで(C)効果が期待でき、クラスタリングに応用される。
VAEは、潜在変数が(D)に従うように調整することで、生成データに連続性とランダム性を持たせることが期待できる。
(A)識別モデル
(B)生成モデル
(C)データ圧縮
(D)一様分布(A)生成モデル
(B)識別モデル
(C)次元圧縮
(D)一様分布(A)識別モデル
(B)生成モデル
(C)次元圧縮
(D)正規分布(A)生成モデル
(B)識別モデル
(C)データ圧縮
(D)正規分布
正解:3
【問87】
オートエンコーダの説明として、最も不適切な選択肢を一つ選べ。
ディープニューラルネットワーク(DNN)がうまく学習できるようになるきっかけとなった。
出力が自己回帰的に生成される。
隠れ層では入力の情報が圧縮されたものが反映される。
入力と出力が同じになるように学習される。
正解:2
【問88】
画像認識モデルを学習する際には、多くのデータが必要となるためデータ拡張を行う場合がある。
データ拡張の手法として、最も不適切な選択肢を一つ選べ。
CutoutとMixupを組み合わせた手法としてCutMixがある。
Mixupとは2枚の画像を合成し、存在しない画像を擬似的に作成する手法である。
OpenCVとはランダムにコントラストを変更し、データを拡張する手法である。
Cutoutとは画像の一部を正方形かつピクセル値が0でランダムにマスクする手法である。
正解:3
【問89】
データ拡張の手法について以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
( )は、学習時に入力画像の矩形領域の位置や大きさをランダムに選び、置き換える輝度もランダムに設定する。
これにより、様々なレベルの遮蔽がある学習データが作成され、過学習のリスクを下げ、遮蔽が発生した場合の汎化性能を維持する。
CutMix
Random Erasing
Mixup
Cutout
正解:4
【問90】
データ拡張の手法について以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
( )は、複数の画像とラベルの要素全体を混ぜ合わせて新たな1つの出力画像とラベルを生成する手法である。
CutMix
Random Erasing
Mixup
Cutout
正解:1
6章 ディープラーニングの応用例
【問91】
畳み込みニューラルネットワーク(CNN)において、畳み込み層で抽出された特徴マップそれぞれの重要度を最終的にシグモイド関数を利用して表現し、その重要度に注目するべき、もしくは注目する必要性が低い特徴マップを認識させる手法として、最も適切な選択肢を一つ選べ。
SENet
VGG
ResNet
FPN
正解:1
【問92】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
WideResNetは、通常のResNetから深さを(A)、ResNetブロック内の畳み込みチャンネルを(B)ことで、性能に対する計算効率を向上させた。
(A)減らし
(B)減らす(A)増やし
(B)減らす(A)増やし
(B)増やす(A)減らし
(B)増やす
正解:4
【問93】
以下の文章を読み、空欄(A)~(C)に最もよく当てはまる選択肢を一つ選べ。
R-CNNは、物体候補領域を(A)を用いて抽出し、(B)で画像分解をする物体検出用のモデルである。
Fast R-CNNは、画像全体で特徴量を抽出することで高速化をしている。
Faster R-CNNは、(A)の代わりに(C)を使用することで更なる高速化を実現している。
(A)SVM
(B)Region Proposal Network
(C)Selective search(A)Selective search
(B)SVM
(C)Region Proposal Network(A)Region Proposal Network
(B)Selective search
(C)SVM(A)Region Proposal Network
(B)SVM
(C)Selective search
正解:2
【問94】
物体検出タスクについて以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
物体検出タスクには、物体クラスの識別と位置の特定を順に行う2段階モデルと、同時に行う1段階モデルがある。
YOLOやSSDはそのうち(A)に分類される。
SSDはYOLOの後継モデルであり、(B)と呼ばれる矩形領域のテンプレートを活用することで、縦長や横長の物体を検出しやすくすることができる。
(A)2段階モデル
(B)アンカーボックス(A)1段階モデル
(B)アンカーボックス(A)2段階モデル
(B)デフォルトボックス(A)1段階モデル
(B)デフォルトボックス
正解:2
【問95】
画像認識に関する説明として、最も適切な選択肢を一つ選べ。
YOLOと呼ばれる物体検出方法では、出力層を工夫することで、入力画像の各位置における物体領域らしさと矩形領域を出力している。
ResNetは、プーリング処理を繰り返すことで分類精度を上げることに成功した画像認識モデルである。
セマンティックセグメンテーションは、画像を入力として、画像を説明する自然言語の文章を出力する手法である。
物体識別タスクにおいて学習されたモデルは、学習時に与えられたクラス以外への分類問題にも無条件で適用可能である。
正解:1
【問96】
マシンスペックが低い端末でも、ある程度の画像認識性能を出すことを目的に作られたディープラーニングのモデルとして、最も適切な選択肢を一つ選べ。
Inception-v3
LeNet
MobileNet
ResNet
正解:3
【問97】
R-CNNは昨今の物体検出モデルの元となったモデルである。R-CNNの説明として、最も適切な選択肢を一つ選べ。
畳み込みニューラルネットワーク(CNN)の出力に対して、物体があると考えられる領域を抽出し、物体検出を行う。
画像を複数のセルに分割し、各セルに物体が存在するかどうかの確率を計算する。
画像に対して、用意したWindowをスライドさせながら、それぞれの領域の中で物体があるかどうかを判断する。
元画像から物体があると考えられる領域を抽出し、その領域に対して画像認識モデルで、物体があるかどうかを判断する。
正解:4
【問98】
SegNetに関する説明として、最も不適切な選択肢を一つ選べ。
デコーダでの拡大時にプーリングインデックスを用いることで、境界付近をぼやけさせないよう工夫されている。
特徴マップを徐々に小さくしていくエンコーダと、徐々に大きくしていくデコーダからなる。
エンコーダとデコーダは対になっており、左右対称のモデル構造をしている。
全結合層を用いず、畳み込み層だけで構成されている。
正解:1
【問99】
リカレントニューラルネットワーク(RNN)や深層強化学習などを用いてネットワーク構造の探索を行うことをNAS(Neural Architecture Search)という。NASで探索されたモデルとして、最も適切な選択肢を一つ選べ。
SENet
ResNet
AlexNet
EfficientNet
正解:4
【問100】
以下の文章を読み、空欄に最もよく当てはまる選択肢を1つ選べ。
( )は、モデルの「深さ」と「広さ」と「解像度」の3つをバランスよく調整するCompound coefficient(複合係数)を導入した。
このネットワークは、従来のネットワークより精度が高いが、改装が小さく、推論が高速であった。また、転移学習でも有用であることを確認した。
NASNet
LeNet
MnasNet
EffcientNet
正解:4
【問101】
SegNetについて、最も適切な選択肢を一つ選べ。
特徴マップを徐々に小さくするエンコーダと、徐々に大きくするデコーダとの間に、異なるサイズの特徴マップを扱うことができるPyramid Pooling Moduleを追加した構造からなる。
全結合層を用いず、畳み込み層とプーリング層だけで構成される。特徴マップは、入力層から徐々に小さくなり、出力層が最も小さくなる。
特徴マップを徐々に小さくするエンコーダと、徐々に大きくするデコーダの対の構造からなる。さらに、正確な位置を把握するために、エンコーダとデコーダとの間を結合させて、エンコーダの特徴マップをデコーダでも利用するようにしている。
特徴マップを徐々に小さくするエンコーダと、徐々に大きくするデコーダの対の構造からなる。エンコーダにおける最大値プーリングによって抽出された位置を記録しておき、デコーダにおける拡大にて利用する。
正解:4
【問102】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
物体検出タスクにおいて、処理の高速化に重点を置き、位置情報の単位をグリッド単位とした1段階モデルを適用した手法を( )という。
EfficientNet
Faster R-CNN
YOLO
R-CNN
正解:3
【問103】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
含意関連認識、質問応答、意味的類似度、文書分類などの様々な言語理解タスクをまとめたベンチマークデータセットとして( )などがある。
MNIST
GLUE
BERT
BLEU
正解:2
【問104】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
TF-IDFにおけるIDFは、( )である。
出現する単語の種類
単語の出現頻度
単語が出現する文書数
単語が出現する文書数の逆数
正解:4
【問105】
自然言語処理において、文章からその言語の意味を持つ最初の言葉の単位に分割し、それぞれの品詞などを判別していく処理として、最も適切な選択肢を一つ選べ。
形態素解析
照応解析
意味解析
構文解析
正解:1
【問106】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
( )は、Google社が開発したTransformerのエンコーダを利用した事前学習モデルである。
MLMとNSPという2つの手法を使って事前学習を行うことで精度が向上した。
転移学習により様々なタスクに適用が可能である。
GPT-3
BERT
GPT-2
GPT
正解:2
【問107】
ChatGPTのベースとなるGPTは、大規模なデータセットを用いることでモデルを大規模化できている。
この前提となる法則として、最も適切な選択肢を一つ選べ。
マルコフ過程
正規化則
中心極限定理
スケーリング則
正解:4
【問108】
前後の単語から中心の単語を予測する自然言語処理モデルの呼称として、最も適切な選択肢を一つ選べ。
GPT
N-gram
スキップグラム
CBOW
正解:4
【問109】
OpenAI社のChatGPTを使用する際に留意すべきこととして、最も不適切な選択肢を一つ選べ。
頻繁に最新情報を用いてモデルをアップデートしているため、古い情報に関する回答精度が低いことに注意する。
あたかも事実かのように回答する可能性があるため、回答を利用する際には事実確認を行う。
有害なコンテンツを出力する可能性があるため、商用サービス等に組み込む際にはその旨を考慮する。
入力した内容が訓練に使用されることがあるため、機微な情報は入力しないように注意する。
正解:1
【問110】
ChatGPT等の言語モデルに対して、プロンプトエンジニアリングが重要と考えられている。プロンプトエンジニアリングの説明として、最も適切な選択肢を一つ選べ。
複数の言語モデルを用意して、そのアンサンブルで回答精度を高めるアプローチ
個別のデータを用いて、言語モデルの一部のパラメータを更新するアプローチ
言語モデルに関する全側面のセキュリティを高めるアプローチ
言語モデルに対する質問の中に、回答する際の役割や制約事項を含めることで、回答精度を高めるアプローチ
正解:4
【問111】
隠れマルコフモデルでモデリングする対象として、最も不適切な選択肢を一つ選べ。
ユーザーの感情の遷移を隠れ状態とした、ツイートトピックの遷移
単語の遷移を隠れ状態とした、音声信号の遷移
品詞の遷移を隠れ状態とした、単語の遷移
日々の新聞の一面トピックの遷移を隠れ状態とした、日経平均株価の遷移
正解:4
【問112】
メル尺度の説明として、最も不適切な選択肢を一つ選べ。
話者や楽器の識別といった、音声認識の分野で利用されることがある。
メル尺度の差が同じであれば、人間が感じる音高の差が同一である。
音の周波数をメル尺度に変換する際は、高周波成分になるほど分解能を高くする。
人間の聴覚、すなわち音の聞こえ方に基づいた尺度である。
正解:3
【問113】
隠れマルコフモデルは何に使用されるか述べたものとして、最も適切な選択肢を一つ選べ。
強化学習の状態価値関数
画像処理の特徴量抽出
音声認識における音素のつながりの推定
テキストデータのクラスタリング
正解:3
【問114】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
音声信号をフーリエ変換することで、周波数スペクトルが得られる。音声認識においては、このスペクトルにおける(A)、すなわちスペクトル包絡が重要である。
メル周波数ケプストラム係数(MFCC)は(B)を考慮した特徴量であり、スペクトル包絡についての情報を含む。
(A)ゆるやかな変動
(B)言語による音韻の分布の違い(A)微細なスペクトルのピーク構造
(B)言語による音韻の分布の違い(A)ゆるやかな変動
(B)ヒトの周波数知覚特性(A)微細なスペクトルのピーク構造
(B)ヒトの周波数知覚特性
正解:3
【問115】次の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
スペクトル包絡を求めると、いくつかの周波数でピークを迎える。このピークを( )と呼ぶ。
周波数スペクトル
フォルマント
音韻
音素
正解:2
【問116】以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
機械学習で音声データを扱う際、音声データの音色を認識するために(A)を求める。
(B)は(A)を求める一般的な方法である。
(A)メル周波数ケプストラム係数(MFCC)
(B)スペクトル包絡(A)メル周波数ケプストラム係数(MFCC)
(B)周波数スペクトル変換(A)スペクトル包絡
(B)周波数スペクトル変換(A)スペクトル包絡
(B)メル周波数ケプストラム係数(MFCC)
正解:4
【問117】
音声認識システムにおける隠れマルコフモデルの機能として、最も適切な選択肢を一つ選べ。
音声波形の圧縮
音声の時系列データのモデル化
ノイズ除去
音響特徴量の抽出
正解:2
【問118】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
音声処理においては、音声をコンピュータ上で扱うため、マイク等から出力される連続的に変化する電気信号から離散的なデータへの変換が行われる。この処理のことを(A)という。
また、周波数スペクトル上に見られるピークの周波数のことを(B)という。
(A)フーリエ変換
(B)メル周波数(A)A-D変換
(B)メル周波数(A)フーリエ変換
(B)フォルマント周波数(A)A-D変換
(B)フォルマント周波数
正解:4
【問119】
深層強化学習などで使われるデュエリングネットワークの説明として、最も不適切な選択肢を一つ選べ。
アルファ碁(AlphaGo)に使われているアルゴリズムである。
学習の状態の情報を受け取った後、状態価値関数とアドバンテージ関数の2つの流れに分け、最後に足し合わせることで、行動価値関数を予測できる。
行動によらず状態価値関数によって学習できる。
DQNなどと組み合わせて利用することができる。
正解:1
【問120】
多人数対戦型ゲーム「Dota2」で世界トップレベルのチームに勝利したゲームAIの名称として、最も適切な選択肢を一つ選べ。
アルファスター(AlphaStar)
アルファ碁(AlphaGo)
アルファゼロ(Alpha Zero)
OpenAI Five
正解:4
【問121】
シミュレーションを用いて予め方策を学習し、その学習した方策を現実世界に転移させる手法の説明として、最も適切な選択肢を一つ選べ。
img2img
A3C
Pix2Pix
sim2real
正解:4
【問122】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
2つのQネットワークを用いることで、Q学習の問題点である過大評価を軽減させるネットワークを( )と呼ぶ。
カテゴリカルDQN
ダブルDQN
ノイジーネットワーク
デュエリングネットワーク
正解:2
【問123】
ノイジーネットワークの説明として、最も適切な選択肢を一つ選べ。
ランダムな行動でエピソード終了までシミュレーションする。
常に報酬の期待値が最高の行動を選択する。
ネットワークのパラメータに正規分布から生成された乱数を加算する。
ある一定の確率でランダムに行動を決定する。
正解:3
【問124】
深層強化学習の応用として、最も適切な選択肢を一つ選べ。
ゲームにおける強化学習はロボット学習と比べて非常に簡単であるため、どんな環境でも少ない計算資源と短時間で学習可能である。
シミュレータを使った深層強化学習を行うことで、実世界における効率的な制御方策を学習することができる。
深層強化学習の手法であるDQNは、元々ロボット制御を行うために開発された手法である。
画像の処理が難しいため、深層強化学習はゲームAIやロボット制御の応用に向かない。
正解:2
【問125】
画像生成モデルである敵対的生成ネットワーク(GAN)の派生系のCycleGANが、それ以前の手法に比べて特徴的である点として、最も適切な選択肢を一つ選べ。
訓練データが少数しかない場合での画像生成タスクに活用できる点
自然文に対応した画像生成タスクに活用できる点
ペアデータが用意された学習データに対するスタイル変換タスクに活用できる点
ペアデータが用意されていない学習データに対するスタイル変換タスクに活用できる点
正解:4
【問126】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
深層生成モデルとして代表的な敵対的生成ネットワーク(GAN)は、ランダムなベクトルを入力して高品質の画像を生成するが、このベクトルの代わりに画像データを入力し、別の画像に変換する処理としたモデルを特に( )と呼ぶ。
元の画像と変換した画像のペアが、本物か偽物かを予測し学習する。
PGGAN
CycleGAN
DCGAN
Pix2Pix
正解:4
【問127】
DCGANの説明として、最も適切な選択肢を一つ選べ。
入力データを統計的な分布のある潜在変数に変換してから、入力データを再現するように学習する。
画像のペアが本物か偽物かを予測することで、学習を進める。
従来の敵対的生成ネットワーク(GAN)の手法で用いられたランダムなベクトルの代わりに、ある画像データを入力し、別の画像へ変換する手法である。
敵対的生成ネットワーク(GAN)に対して、畳み込みニューラルネットワーク(CNN)を適用したものである。
正解:4
【問128】
比較的少量の画像データしか得られない場面において、高い精度のモデルを手に入れるために考えられうる学習戦略として、最も不適切な選択肢を一つ選べ。
NAS(Neural Architecture Search)
転移学習
データオーグメンテーション
ファインチューニング
正解:1
【問129】
事前学習の説明として、最も適切な選択肢を一つ選べ。
事前学習は、学習前に最適なハイパーパラメータを見つける手法である。
事前学習により、ハイパーパラメータを直接最適化できる。
近年、大規模な事前学習をおこなった学習モデルは、事前学習に使うデータセットの規模に関わらず最終的な性能は一定ということが証明され始めている。
事前学習は、大規模なデータセットで事前に学習済みのニューラルネットワークモデルを部分活用することで、学習を効率化する手法である。
正解:4
【問130】
転移学習を行う際の転移元-転移先の例として、最も適切な選択肢を一つ選べ。
OCRのモデルを転移し、翻訳モデルを学習させる。
経済のニュースの要約を学習したモデルを転移し、株価の時系列予測モデルを学習させる。
ニュースの要約を学習したモデルを転移し、OCRを学習させる。
猫の画像分類を学習したモデルを転移し、犬の画像分類を学習させる。
正解:4
【問131】
大量のデータが収集可能となった昨今において、半教師あり学習は注目を集めている学習手法の1つである。
半教師あり学習の特徴として、最も適切な選択肢を一つ選べ。
画像分類モデルには適用可能だが、物体検出モデルやセグメンテーションモデルには適用できない。
ディープラーニングモデルのみに使用可能な手法であり、サポートベクターマシン(SVM)などの古典的な機械学習モデルには適用できない。
ラベルありデータとラベルなしデータの双方を用いた学習手法であり、一般的にはラベルありデータの方が多い場合に使用される。
ラベルありデータとラベルなしデータの双方をモデルの学習に使用できるので、アノテーションコストが高いディープラーニングと親和性が高い。
正解:4
【問132】
マルチタスク学習の説明として、最も適切な選択肢を一つ選べ。
画像セグメンテーションと文書分類といった複数のタスクを1つのモデルで学者できる。
複数のタスクを1つのモデルで処理する必要があるため、各タスクの精度には一般には低くなる。
音声合成以外の複数のタスクを1つのモデルで学者できる。
画像、テキスト、音声といった様々なデータを1つのモデルで学者できる。
正解:1
【問133】
説明可能AI(XAI)の技術の説明として、最も適切な選択肢を一つ選べ。
モデルの柔軟性を高めるための手法と、モデルの汎用性を高めるための手法がある。
モデルの精度を高めるための手法と、モデルの効率を高めるための手法がある。
モデルの透明性を高めるための手法と、モデルの解釈性を高めるための手法がある。
モデルの安全性を高めるための手法と、モデルの倫理性を高めるための手法がある。
正解:3
【問134】
AIモデルの解釈性向上のために使われ、特定のサンプル空間に対する予測を線形回帰モデルで近似することで、そのサンプル空間の予測における説明変数の寄与度を測定できる手法として、最も適切な選択肢を一つ選べ。
CAM
SHAP
Grad-CAM
LIME
正解:4
【問135】
Grad-CAMの説明として、最も適切な選択肢を一つ選べ。
入力データを調整して、ニューラルネットワークと等価な決定木を作成する。
推論結果に対する、特徴量ごとの寄与度に分解する。
入力データを少しずつ変更して、結果を比較することで、予測にどのような変化が起こるかを検証する。
畳み込みニューラルネットワーク(CNN)の推論結果における、位置情報の影響度を画像上に協調したマップとして表示する。
正解:4
【問136】
協力ゲーム理論のシャープレイ値を用いて、予測の根拠となった特徴量を提示する手法として、最も適切な選択肢を一つ選べ。
influence
SHAP
Anchor
LIME
正解:2
【問137】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
エッジデバイスで深層学習モデルを動かすため、しばしば( )と呼ばれる、モデルの重みそれぞれをより少ないバイト数で表現するためのプロセスが取られることがある。
標準化
プルーニング
蒸留
量子化
正解:4
【問138】
AIシステムの提供方法のうち、小型の計算機を活用するエッジ方式に関する説明として、最も不適切な選択肢を一つ選べ。
利用現場側に配備した各エッジデバイスを機器として、長期間保守・運用し続ける必要がある。
モデルの推論はエッジデバイス上で計算処理されネットワークを使用しないため、通信遅延の影響を受けない。
モデルの推論はエッジデバイス上で計算処理されネットワークを使用しないため、通信量が少なくてすむ。
データの蓄積やモデルの更新も各エッジデバイスで実施されるため、サービスのメンテナンスが容易である。
正解:4
【問139】
モデル圧縮に関する以下の文章を読み、空欄(A)~(C)に最もよく当てはまる選択肢を一つ選べ。
(A)は、重みの小さい接続を削除することでパラメータ数を減少させる手法である。
(B)は、重みなどのパラメータをより小さいビットで表現する手法である。
(C)は、大きいモデルやアンサンブルモデルを教師モデルとして準備し、その教師モデルの推論結果を生徒モデルの学習に利用することで、軽量でありながら教師モデルに同等の精度を期待できるモデルを作成する手法である。
(A)プルーニング
(B)蒸留
(C)量子化(A)蒸留
(B)プルーニング
(C)量子化(A)蒸留
(B)量子化
(C)プルーニング(A)プルーニング
(B)量子化
(C)蒸留
正解:4
7章 AIの社会実装に向けて
【問140】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
日本経済団体連合会は、2019年に「AI活用戦略」を発表した。
その中で定義している「( )な企業」を5段階のレベルで提示している。
RPA-Ready
DX-Ready
DL-Ready
AI-Ready
正解:4
【問141】
AI技術の社会実装などに向けて取り組まれているオープン・イノベーションの説明として、最も適切な選択肢を一つ選べ。
社会人になった後も、必要なタイミングで教育機関や社会人向け講座に戻り学び直すこと。
事業会社が社外のスタートアップに対して行う投資活動のこと。
株を投資家に売り出して、証券取引所に上場し、誰でも株取引ができるようにすること。
製品開発や技術改革、研究開発や組織改革などにおいて、自社以外の組織や機関などが持つ知識や技術を取り込んで自前主義からの脱却を図ること。
正解:4
【問142】
AIをビジネスに利活用する際、法的・倫理的な検討を行うタイミングとして、最も適切な選択肢を一つ選べ。
運用を開始する段階
データを収集する段階
実装・評価する段階
AIを活用するプロジェクトの企画段階
正解:4
【問143】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
AIモデルを構築するためには、( )フェーズにおいて十分なデータの精査と精度検証を繰り返すことで実用的なモデルを作成することが重要である。
デザイン思考
アジャイル
DevOps
PoC
正解:4
【問144】
ビジネスの課題の理解を起点に6つのフェーズから構成されるデータマイニングのプロセスモデルとして、最も適切な選択肢を一つ選べ。
PDCA
SDLC
ALM
CRISP-DM
正解:4
【問145】
ブラウザ上でPythonのプログラムを実行できるツールとして、最も適切な選択肢を一つ選べ。
Jupyter Notebook
PyTorch
Theano
Anaconda
正解:1
【問146】
機械学習モデルの実装から運用までのライフサイクルを円滑に進めるための管理体制を築くこと、もしくはその概念全体を指す言葉として、最も適切な選択肢を一つ選べ。
DevOps
CRISP-DM
MLOps
PMBOK
正解:3
【問147】
IoTシステムで、利用者や端末に近い地点でデータを分析・判断したい時に活用する技術として、最も適切な選択肢を一つ選べ。
並列コンピューティング
クラウドコンピューティング
グリッドコンピューティング
エッジコンピューティング
正解:4
【問148】
CRISP-DMについて述べたものとして、最も適切な選択肢を一つ選べ。
国立情報学研究所に設立された共同研究部門。「頑強な知識基盤」と「社会課題解決型技術」に主眼を置き、社会問題を解決できるような情報技術の研究開発の取り組み。
ITシステム開発で用いられる手法。開発手順を1つずつ確認しながら工程を進めていく。工程が次のフェーズに進んでしまうと後戻りが出来ない。
ゲノム編集に用いられる手法。ある塩基配列のDNA切断機構を利用し、ターゲットのDNAを切断し編集する技術である。
データマイニングのための産業横断型標準プロセス。6つのステップに分割されているが、相互に行ったり来たりするプロセスがある。
正解:4
【問149】
機械学習モデルのデータ収集や取り扱い方のうち、データリーケージに当たる事例として、最も適切な選択肢を一つ選べ。
ある決まった場所の翌日の天気を予想するモデルを作る。学習データセットはその場所の2年前の気象データを使い、検証データセットは学習データセットと相互関係がないように1年前の気象データを用いた。
物体検出のモデルの学習をするとき、同じ物体をいろいろな角度から撮影した写真をすべて学習用に使った。学習データに同じ物体の写真が増えてしまったが問題なしとした。
学習データが少なかったため、画像を変形したり左右反転したりしてデータの水増しを行った。
不特定多数の利用者が想定されるチャットボットを作るため、Q&Aのデータを集め、学習用・検証用・テスト用データセットにランダムに分けた。このとき、まとまった1つの対話内容が分断され、それぞれ学習データとテストデータに含まれた。
正解:4
【問150】
サンプリングバイアスに関する記述として、最も適切な選択肢を一つ選べ。
サンプルの抽出元である母集団のサイズが小さいほど、サンプリングバイアスの影響は小さくなる。
サンプル抽出の際に、母集団の一部の属性が他の属性よりも選択されやすい状況においてサンプリングバイアスが発生しやすい。
標本抽出が完全に無作為に行われている限り、サンプリングバイアスを必ず排除することができる。
サンプリングバイアスは、母集団から抽出したサンプルデータが元の母集団を正確に反映している場合にのみ発生する。
正解:2
【問151】
教師あり学習のための正解データを作成するアノテーション作業に関する説明として、最も不適切な選択肢を一つ選べ。
特定の個人を識別できないように顔をマスク処理するなど、匿名加工の必要性を検討する。
作業者が要件を理解できるよう、判断軸・誤差範囲や具体例などを記載したマニュアルを作成する。
作業者のアサインメントを調整し、レビュープロセス等の仕組みを整備して作業のばらつきを防ぐ。
人的コストの増大を避けるために、なるべく外部委託を避けて社内メンバーで作業を進める。
正解:4
【問152】
既存のモデルの一部を再利用し新しいタスクに適応させる手法として、最も適切な選択肢を一つ選べ。
蒸留
転移学習
延伸学習
ドメイン転移
正解:2
【問153】
サンプリング・バイアスを防ぐための防止策として、最も適切な選択肢を一つ選べ。
母集団の個体にIDを振って、IDが小さいほうから必要数だけ順番にサンプルを取得すること。
ランダムサンプリングを行い、母集団全体を代表するサンプルを選択すること。
特定の層や属性を対象にしたサンプリングを行い、結果を一般化すること。
サンプル数を減らし、効率的なサンプリングを行うこと。
正解:2
8章 AI に必要な数理・統計知識
【問154】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
( )は、コイン投げの「表が出る」「裏が出る」のように試行の結果が2種類しかなく、各試行が独立で、各試行が同じ分布である。
t分布
正規分布
ポアソン分布
ベルヌーイ分布
正解:4
【問155】
標準偏差について説明した以下の文章を読み、空欄( )に最もよく当てはまる選択肢を一つ選べ。
標準偏差はデータのばらつきを表す指標であり、値が大きいほどばらつきは( )。
小さい
大きい
平均的
定数
正解:2
【問156】
以下の文章を読み、空欄(A)(B)に最もよく当てはまる選択肢を一つ選べ。
疑似相関を持つある2つの事象を考える。このとき2つの事象の間に因果関係は(A)。また2つの事象の間に相関関係は(B)。
(A)無い
(B)無い(A)有る
(B)無い(A)無い
(B)有る(A)有る
(B)有る
正解:3
【問157】
ある店舗の鮭おにぎりの販売数と、その日の気温の相関関係を計算したところ、0.7となった。この分析結果を踏まえて、その店舗がとる施策として、最も適切な選択肢を一つ選べ。
気温に限らず、鮭おにぎりの仕入数を減らす。
気温が高くなる日には、鮭おにぎりの仕入数を多くする。
気温が高くなる日には、鮭おにぎりの仕入数を減らす。
気温が低くなる日には、鮭おにぎりの仕入数を多くする。
正解:2
【問158】
ある会社は、A社、B社、C社、D社から同一製品の仕入れを行っており、各社の製品の納品数・不良品率が以下のとおりである。
A社・・・納品数400、不良品率0.01
B社・・・納品数300、不良品率0.015
C社・・・納品数200、不良品率0.02
D社・・・納品数100、不良品率0.035
ある1つの製品が不良品であるとき、その製品の仕入先である確率が最も高くなる会社として、最も適切な選択肢を一つ選べ。
D社
B社
C社
A社
正解:2
【問159】
ピアソンの積率相関係数と自然言語処理や画像処理でも用いられるコサイン類似度について、最も適切な選択肢を一つ選べ。
積率相関係数とコサイン類似度の範囲は共に0から100までである。
ピアソンの積率相関係数の範囲は-1から+1までだが、コサイン類似度の範囲は0から100までである。
ピアソンの積率相関係数は0から100までだが、コサイン類似度の範囲は-1から+1までである。
ピアソンの積率相関係数とコサイン類似度の範囲は共に-1から+1までである。
正解:4
【問160】
ユーザ企業が保有する個人データをAIベンダに提供して、AI開発に活用したい。
この場合に、本人の同意に関して、原則として企業が採用する手段として、最も不適切な選択肢を一つ選べ。なお「本人」とは、個人情報から識別される特定の個人を指す。
適切な情報提供と本人の同意を得て、ユーザ企業とは直接に関係ないAIの研究開発のために海外のベンダに提供する。
適切な情報提供と本人の同意を得て、ユーザ企業とは直接に関係ないAIの研究開発のために国内のベンダに提供する。
ユーザ企業が保有する個人データを、ユーザのために行うAI開発の目的で、本人から同意を得ずに、海外のベンダに提供する。
ユーザ企業が保有する個人データを、ユーザのために行うAI開発の目的で、本人から同意を得ずに、国内のベンダに提供する。
正解:3
【法律・倫理分野】
9章 AIに関する法律と契約
【問161】
個人情報保護法の説明として、個人情報保護委員会のガイドラインを前提に、最も適切な選択肢を一つ選べ。
従前に定めた利用目的からすると、AIによる情報処理に個人情報を利用することができなかったため、個人情報を統計データに加工した上でAIによる情報処理を行うこととした。この場合でも、統計データの加工を行うことが利用目的に記載されていなければ、違法となる。
ストックした個人情報をAIによる情報処理を活用したマーケティングに利用する場合、個人情報の利用目的として「マーケティング活動」と定めれば、あらゆる会社にとって、必要十分な望ましい記載となる。
従前に定めた利用目的からするとAIによる情報処理に個人情報を利用することができないとしても、変更前の利用目的と相当の関連性を有すると合理的に認められる範囲を超えないのであれば、利用目的の変更を行うことにより利用できるようになる。
AIを活用した情報処理に個人情報を利用することが従前に定めた利用目的の範囲外となってしまい、かつ、利用目的を変更しようにも適法となる範囲を超えてしまう場合であったとしても、本人の同意を得れば、AIを活用した情報処理に利用することができる。
正解:3
【問162】
AIの開発に個人情報を使用することがある。個人情報のうち、要配慮個人情報に該当するものとして、最も不適切な選択肢を一つ選べ。
本人が信仰する宗教に関する情報
本人の銀行口座の番号
本人が何らかの障害を持っているかどうか
本人が今まで受けた治療
正解:2
【問163】
AIと著作権の関係について、最も適切な選択肢を一つ選べ。
「生成」のボタンを押すだけでAIが生成したものも、プロンプトによる指示によってAIが生成したものも、AIが生成したものであることに変わりはないため、著作物に該当することはない。
自身の著作物との「類似性」が認められるAI生成物が利用されていても、自身の著作物がAIに利用されることを禁ずる旨をあらかじめ表明していなければ、著作権侵害は成立しないことに留意が必要である。
既存の著作物との「類似性」が認められるAI生成物の(著作権者の許諾なく行われる)アップロードや販売は、当該生成物の既存の著作物への「依存性」が認められる場合に限って著作権侵害となる。
AIと著作権に関しては「AI開発・学習段階」と「生成・利用段階」などとプロセスを必要以上に細分化するのではなく、プロセス全体を1つの行為と捉えて、1つの著作権侵害の成否を検討すべきである。
正解:3
【問164】
AIの学習及び推論に用いるコードの著作権について、最も不適切な選択肢を一つ選べ。
契約により自社のオリジナルのアルゴリズムを実装したコードの著作権を譲渡したとしても、異なる表現によりコードを記述すれば同じアルゴリズムを実装してかまわない。
会社に職務著作の著作権が帰属する旨の社内規定が存在しない場合、会社の職務によりコードを作成すれば原則として従業員たるコード作成者に著作権が成立するする。
AIの開発委託契約において、学習用コードの著作権帰属先と推論用コードの著作権帰属先を分けることも可能である。
Githubなどに公開されているコードを利用して学習用コードを作成する場合、利用条件に従う旨の同意を行った場合、当該利用条件に従う必要がある。
正解:1
【問165】
著作物であるAI生成物に対して著作権が認められる場合として、最も適切な選択肢を一つ選べ。
AI利用者が生成AIに入力するプロンプトの内容を試行錯誤し、非常に詳細なプロンプトを作成して画像を生成させた場合、AI利用者に当該画像の著作権が発生する可能性がある。
AI利用者が生成AIに「ゴッホ風の車の絵を描いて」とプロンプトに入力して画像を生成させた場合、創作者であるAI利用者に当該画像の著作権が発生する可能性がある。
生成AIの開発がなければ生成物も生まれないため、AI開発者には当該AIから生じる全てのAI生成物の著作権が発生する可能性がある。
著作権は、著作物の創作を行った者に帰属するため、生成AI自身に著作権が発生する可能性がある。
正解:1
【問166】
AIの特許に関する記述として、最も不適切な選択肢を1つ選べ。
学習済みモデルの出力の中から、特定の出力を人間が選択して課題の解決をしたとしても、発明者として認定される可能性は無い
学習用データの変更により、従来の技術常識ではない相関関係を利用して顕著な効果を示す場合、進捗性が肯定される。
学習用データの選択や前処理が発明の特徴的部分を構成する場合がある。
AIが自律的に一見「発明」に該当する。成果物を生成したとしても、日本においては、AIが特許権者になる事は無い。
正解:1
【問167】
不正競争防止法における情報の扱いに関して、最も適切な選択肢を一つ選べ。
営業秘密を含む情報に関して、営業秘密である情報に接することができる従業員からみて秘密にすべきであることが明確に分かるような管理措置が求められている。
限定提供データは、営業秘密に該当しビジネスに有用な情報を含むデータとして定義される。
営業秘密の侵害に対する措置として、差止請求権や損害賠償請求権などの救済が可能であるが、刑事罰が科せられることはない。
施策の失敗に関する記録などのネガティブインフォメーションは有用な情報ではないとされるため、営業秘密として保護されない。
正解:1
【問168】
次の事例のうち、私的独占の禁止及び公正取引の確保に関する法律(独占禁止法)に違反する可能性が最も小さい選択肢を一つ選べ。
競売事業者が、それぞれ自らの利益の最大化を目指すAI技術を導入し、特に他社との申し合わせや意見交換をすることなくAIが自動で学習を繰り返した結果、他社と価格協調行為をとるようになった場合
競争事業者が、販売価格を維持し引き上げるため同じアルゴリズムを用いることを申し合わせて、それぞれ当該アルゴリズムを用いて価格決定を行った場合
競争事業者が、競争事業者間での直接の意思の連絡を欠くものの、価格決定のために同じAI技術を採用し、そのことを相互に認識している場合
プラットフォーム事業者が、利用事業者のランキングを決定するアルゴリズムを一方的に不利益変更する場合
正解:1
【問169】
AI開発委託契約について、最も不適切な選択肢を一つ選べ
アセスメントに際して、秘密保持契約(NDA)のみを締結することもあるが、有償の業務委託契約を締結することもある。
PoCはその内容から推論用プログラムなどの成果物の納品を前提とするため、契約書においてそれらの知的財産の帰属を定める必要がある。
委託者、受託者双方のノウハウが重要であることから、秘密保持条項などでその保護を図る必要がある。
PoC後の開発契約でも準委託契約が親和的なことが多い。
正解:4
【問170】
秘密保持契約(NDA)について、最も適切な選択肢を一つ選べ。
データ分析の実行可能性や方針はデータを観察してから決まることがほとんどであるため、NDAはデータ分析の方針が定まり次第、締結すべきである。
ビジネスパートナー間での機密情報を含むデータを送付し受領する前に、NDAを締結すべきである。
NDAは、機密情報を共有する全てのメンバーが当該情報を自由に公開できる権利を付与する契約である。
NDAは、両者のどちらかが機密情報を漏洩した場合に、被害者が漏洩させた側を裁判所に報告することを可能にする契約である。
正解:2
【問171】
AI開発に関連する秘密保持契約(NDA)について、最も不適切な選択肢を一つ選べ。
学習用データに関するNDAは、法令上禁止行為が明確な知的財産権に関する利用許諾契約と異なり、利用を禁止する制限を明確にして目的外利用の禁止等の禁止義務を課す点に特徴がある。
学習用データが秘密情報として提供された場合において、その使用目的を本開発の目的としたときは、本開発終了後に自社のAIの研究開発のために利用することはできない。
本開発で使用する情報を提供する上で、本開発契約とは別にNDAを締結する場合、秘密情報の使用目的として、本開発目的という限定を記載すべきである。
重要な情報が提供されるのは本開発であるから、NDAを締結するのは本開発の業務委託契約を締結する前であって、PoC契約の前ではない。
正解:4
10章 AI倫理・AIガバナンス
【問172】
AIガバナンスを適切なに行う上で、AIの出力等に人間が関与することを重視する試みがある。
この「人間の関与 human oversight」について、最も適切な選択肢を一つ選べ。
AIガバナンスにおける人間の関与は、人間とAIがお互いの強みを活かしあう「AIとの協働」という観点からも意義を持つ。
AIガバナンスにおける人間の関与は、人間の関与によってシステム全体の精度が必ず向上することを前提にしている。
AIガバナンスにおける人間の関与は、AIの出力を有効化する前に行わなければ意味を持たず、事後的な確認等は想定されていない。
AIガバナンスにおける人間の関与は、対象となるAIについて第三者による監査を受けることを前提にプロセスを策定することが中心となる。
正解:1
【問173】
AIに対する規制の動向について述べたものとして、最も不適切な選択肢を一つ選べ。
政府機関においてAIアプリケーションを導入する際の方針を取り決める動きがある。
日本では、AIのみに適用される特別な規制は存在しないから、AIによる何らかの問題が生じたとき、一般的な法律により解決が図られる。
欧州委員会は、リスクに応じてAIシステムを4段階に分類するリスクベースアプローチを採用し、最低限のリスクしかもたないAIシステムにも、新たに重い義務を課した。
諸外国を見ると、警察などによる公共空間でのリアルタイムの顔認証を行うことを原則として禁止しようという提案も見受けられる。
正解:3
【問174】
プライバシーに関わる情報を用いたAIの利用について、最も適切な選択肢を一つ選べ。
購買履歴、店舗の訪問履歴などのそれ単体のみでは個人を識別できず、プライバシーを侵害するおそれも低い場合がある情報であっても、AIによって(他の情報とも結合して)大量に集積・分析されるのであれば、プライバシーの観点から問題が生じる性質の情報であるため、倫理やプライバシーの観点からは、その取扱い方針を慎重に検討する必要がある。
AIシステムを用いて顔画像などの生体認証を行うことは、社会公共目的の有益な機能であるため、これを禁止する法制度が国内外で提案されたことはない。
AIによるプロファイリングをすることによって特定の個人の行動履歴等を推測することは、そのような行動履歴等の推測に利用するという利用目的をあらかじめ公表してさえいれば、内定辞退率等の推測に用いていたとしても、AI倫理・プライバシーの観点から問題が生じることはない。
プライバシーに関する情報をAIを用いて分析して個人の信用力をスコアリングする場合、その機能をデフォルトでオンにしていたとしても、利用者側でオフに操作することができる以上、AI倫理・プライバシーの観点から問題が生じることはない。
正解:1
【問175】
カメラ画像利活用ガイドブックにおけるプライバシー保護の観点から具体的に注意すべき点に関する記載として、最も不適切な選択肢を一つ選べ。
事業者自らが管理を行う空間であっても、準公共空間については、公共空間との物理境界が明確でないことから、公共空間における注意事項に準じて、十分な配慮をすることが望まれる。
カメラ画像から、信条、健康、内心などに係る情報を抽出して推定を行ったりすることについては、プライバシーへの影響が高いため、慎重な配慮が求められる。
公共空間において、公共性の高い調査のために、動線分析等プライバシーリスクの相対的に高い利用の実施が許容される場合には、調査の重要性に鑑み、撮影期間や撮影エリアを限定しない撮影が許される。
特定の個人のデータを取得する時間的範囲・空間的範囲が広がるほど、特定の個人の行動が詳細に把握可能になるため、プライバシーの観点から注意が必要である。
正解:3
【問176】
データセットの偏りの説明として、最も不適切な選択肢を一つ選べ。
欧米主導した共有データセットの場合、アジア系やアフリカ系などのデータが学習に反映されていないことがある。
既存のデータセットや特定のコミュニティから抽出したデータには、偏り・過少代表・過大代表が生じている恐れがある。
データセットの偏りは現実世界の偏りを反映したものなので、調整・加工してはいけない。
認知されていない犯罪など、本来存在するデータがデータベースに登録されていないことでデータセットの偏りが生じる恐れがある。
正解:3
【問177】
機械学習における公平性に関する説明として、最も不適切な選択肢を一つ選べ。
機械学習モデルの公平性の確保については、欧州委員会による「Ethics guidelines for trustworthy AI(信頼できるAIの倫理方針)」や、内閣府による「人間中心のAI社会原則」や総務省による「AI利活用ガイドライン」などでも言及されている。
機械学習モデルによる不当な差別が生じる背景の1つとして、AIは実際のデータから規則性を学習するため、その判断には現実に起きた歴史的・社会的な差別の結果を所与のものとして学習したり、データの選び方や学習アルゴリズムなどにより、その差別がより強化されてしまうことが挙げられる。
AIによる不公正なバイアスには、データにおいて生じるバイアスや、学習において生じるバイアスがある。学習において生じるバイアスが特に問題になっており、様々な対策が講じられている。
AIにおける公平性の内容には、機械学習モデルが不当な差別を引き起こさないように留意するよう配慮したり、AIの学習に用いられるデータの代表性やデータに内在する社会的なバイアス等に留意することが含まれる。
正解:3
【問178】
AI分野における「アカウンタビリティ」という用語について述べたものとして、最も適切な選択肢を一つ選べ。
AIを活用して問題が発生した場合、状況や理由にかかわりなく賠償義務を負うため、注意が必要である。
AIを活用した人事により、性別を理由とした差別が発生した。誤判定に至ったAIシステムの計算内容を説明すれば、謝罪の必要は無い。
説明責任という日本語訳があてられることがあるが、説明すれば終わりではなく、賠償責任が問題となることもある。
AIによる自動運転システムにより事故が発生した。誤判定の理由を説明すれば、賠償責任を負うことは無い。
正解:3
【問179】
AIの導入や運用に際して生じるセキュリティ上の問題への対応に関する記述として、最も適切な選択肢を一つ選べ。
ユーザにデータを入力させAIの出力結果であるラベルと信頼スコアを利用させるサービスでは、学習データを公開しないことで、いかなる学習データが含まれていたのかという情報を第三者に取得されることがなくなると考えられる。
ウェブ上から取得したデータを学習させる場合はAIの内部構造を公開せずに開発を進めることで、誤った判断にAIを誘導するような攻撃を受けることがなくなると考えられる。
第三者が公開しているAIシステムを導入するにあたっては、AIの判断精度の検証を実施することで、セキュリティ上の問題の抑制が期待できると考えられる。
信頼できる開発会社が提供するAIの導入や学習データに汚染データが含まれていないか検知するなどの方策を実施することで、セキュリティ上の問題の抑制が期待できると考えられる。
正解:4
【問180】
ディープフェイクに関する技術面の説明として、最も不適切な選択肢を一つ選べ。
顔のパーツ認識モデルと生成モデルを組み合わせることで、学習データに含まれない表情も作成可能である。
技術の進歩により、人間の目は真贋が判別できないほど精巧なものになっている。
主に敵対的生成ネットワーク(GAN)や拡散モデルを用いて偽物の画像や動画が生成されている。
音声の模倣は難しいため、偽物の動画は音声に注意すれば判別が可能である。
正解:4
【問181】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
ディープフェイクはディープラーニングとフェイク(偽物)を組み合わせた造語であり、有名人の顔画像を用いて実際には存在しない猥褻な動画が作成されたり、政治家の発言が捏造されたりしており社会問題となっている。
作成の際には( )と呼ばれる手法が使われることが多い。
LSTM
敵対的生成ネットワーク(GAN)
セグメンテーション
敵対的攻撃
正解:2
【問182】
インターネット上において、いわゆるフェイクニュースが顕在化する一因と考えられている現象についての説明として、最も不適切な選択肢を一つ選べ。
フェイクニュースの定義は研究者によって様々で、必ずしもフェイク(嘘)ではないものも含まれており、嘘か真実かは主観によって変わる可能性がある。
フェイクニュースが顕在化する背景として、近年の社会はポストトゥルース、すなわち客観的事実の影響力よりも感情的な意見の方がより強い影響力をもつ状況があることが指摘されている。
エコーチェンバー現象の問題点の1つとして、あるグループが極端な意見にシフトしてしまう集団分極化という現象が挙げられる。
インターネットの利用者はパーソナライズされた検索エンジンによって表示された結果を見ることができるので、フィルターバブルは目に見えるものとされている。
正解:4
【問183】
フェイクニュースに関する説明として、最も適切な選択肢を一つ選べ。
AIサービス提供者にとって、フェイクニュースの生成を止める手段として、利用規約等で禁止することが考えられる。
ディープフェイク動画は、極めて精巧に作られているため、AIがフェイクかどうかを見分けることは困難である。
ディープフェイク技術が実際の犯罪に使われた例はまだ存在しない。
大規模言語モデルは、違法な内容の出力をしないよう訓練されていることからフェイクニュースを生成することはない。
正解:1
【問184】
AIのブラックボックス問題に関する説明として、最も適切な選択肢を一つ選べ。
AIの学習に使われたデータが漏洩することがないセキュアな状態を指す。
AIシステムの意思決定プロセスが不透明で、その理由付けを理解するのが困難であることを指す。
AIが特定のタスクで人間の能力を超える性能を発揮することを指す。
AIの内部仕組みの理解を必要とせずにAIがユーザの要求に応じて正確に動作することを指す。
正解:2
【問185】
AIの説明可能性に関する説明として、最も適切な選択肢を一つ選べ。
説明可能性を提供する技術を利用する上で、説明が適切かどうかは常に検討されるべきである。
説明可能性は、常に利用者と技術者双方に対して提供されるべきものである。
説明可能性は、ブラックボックス化を防ぐために重要なので、コストを度外視して常に提供されるべきである。
決定木のモデルを利用することで、常にAIの判断根拠を人間が理解できる。すなわち説明可能性を付与することができる。
正解:1
【問186】
AIが与える地球環境への影響などのAIサステナビリティ上の課題について、最も不適切な選択肢を一つ選べ。
AIの学習や推論により発生する電力消費を抑えるべく、環境負荷の少ないモデルの開発が進められている。
運搬などの分野で効率の良い経路を導き出すことで、運搬によるエネルギー消費を抑えるというAIを用いた環境保護の取り組みが存在する。
AIに多数のデータを学習させることは、学習効率が向上するため、電力消費量が少数データの学習の場合に比べて低下する。
モデルの巨大化・複雑化に伴い学習に必要な電力の増大がサステナビリティの点から問題となっている。
正解:3
【問187】
以下の文章を読み、空欄に最もよく当てはまる選択肢を一つ選べ。
Google社がエッジデバイス向けに開発したEdge TPUは( )が特徴のASICである。
専用チップ(ASIC)上の回路面積の大きさ
様々なネットワークやアルゴリズムが容易に適用できる汎用性
モデルの推論だけでなく学習もエッジ側で行う余地
推論処理実行時の消費電力の効率の良さ
正解:4
【問188】
AIが労働や仕事に与える影響について、最も不適切な選択肢を一つ選べ。
AIの導入について、経営者が責任をもってAIの導入を進めるべきであり、労働組合や労働者に導入に関する意見を求めることは、推薦されない。
AIの導入により、従来人間が行っていた業務が自動化され人間が行わなくなることによる人間の能力の低下の可能性が課題として挙げられている。
職場で利用するためのAIを作成する目的で、従業員に関するデータを収集するには、従業員は収集を拒否しにくい状況にあることを考慮に入れて行う必要がある。
AIが人間の仕事を奪うという恐怖感が社会に存在する一方で、タスクのすみ分けの在り方を冷静に考えるべきであるとの指摘も存在する。
正解:1
【問189】
既に亡くなっている特定の個人のように振る舞うAIの開発にあたっては、倫理的な観点から検討が必要である。このような観点から行った検討として、最も不適切な選択肢を一つ選べ。
生前に自己のように振る舞うAIの開発をして良いとの許諾を本人から得ていた場合、故人本人に対して敬意を払ったといえこれ、以上に検討すべき要素はない。
生者が保有するデータをもとに再現するしかない以上、生者に都合のいい死者像をよみがえらせるものだと批判されることも考えられる。
故人のように振る舞うAIの開発にあたっては、遺族からの真摯な同意を得たとしても、故人本人を尊重しなければならないことは別問題である。
故人のように振る舞うAIが、生前のその人であれば取らないような行動や言動を取った場合、故人の生前のイメージを損なうと批判されることも考えられる。
正解:1
【問190】
国内外のAIポリシーの策定状況について、最も適切な選択肢を一つ選べ。
AIには公式な定義は存在しないので、ポリシー内でAIを定義しているポリシーがある。
近年のAIの利活用におけるリスク意識の高まりから、AIを取り扱う日本の民間企業においてAIポリシーの策定は義務化された。
日本ではAIの利活用とプライバシーの問題がメディアで多数取り上げられていることから、現在策定されている全ての日本の民間企業主導のAIポリシーで、プライバシーの価値が掲げられている。
日本ではAIの公平性が問題として取り上げられることは少ないため、日本の民間企業主導のAIポリシーにおいて公平性の価値を掲げているものはない。
正解:1
あとがき~傾向と対策
出題は毎回200問前後で、問題数は変動します。制限時間は120分ですので、1問あたりに使える時間は32~38秒と、かなりタイトになっております。
試験中に調べる行為自体は禁止されておりませんので、参考書やまとめ(いわゆるカンペ)を見ながら解くことができます。ただし、当然ながら試験問題が表示された画面からの切り貼り(コピペ)はできません。
「ググればなんとかなる」「AIに教えてもらおう」とパソコンやスマホに入力するにしても、問題文や選択肢を長々と手入力していたのではとても時間が足りません(音声入力も大して変わりません)。何せ1問に使える時間は30秒ちょっとです。
やはり、それなりに事前学習は必要です。悩まずノータイムで解くことができる問題をなるべく増やし、コンピュータに頼るのは余った時間で調べる程度にしておくぐらいの気持ちで臨むのが良いでしょう。
問140のように「AI活用戦略」を問う内容で、選択肢に「AI」と付くものは選択肢4の「AI-Ready」しかありません。
また、問174の選択肢2に「禁止する法制度が国内外で提案されたことはない」という記述がありますが、冷静に考えれば、国内外で提案されたことがこれまでにあったかなかったかなど事実を検証する方法がありません。この選択肢は誤りであると分かります。
これらのように、たとえ知らない内容であっても落ち着いて考えれば正解できる問題もありますので、慌てず問題文をしっかり読むようにしましょう。
そして、問題文には「適切な」と「不適切な」のどちらを選ぶのか2通りあります。間違えないよう特に注意しましょう。
出題範囲については、
1章-4問 2章-14問 3章-23問 4章-26問 5章-23問
6章-49問 7章-14問 8章-7問 9章-11問 10章-19問
と、特に4~6章から多く出題されています。
特に機械学習についての専門用語が多く使われる範囲でもあり、事前の整理が必須です。簡単で構わないので、単語と特徴を紐づけておき、試験中に参照することをお勧めします。一覧表形式で見やすく作っておくと良いでしょう。
この記事が気に入ったらサポートをしてみませんか?