◾️はじめに
ITパスポート という国家試験の勉強を始めました。
「試験勉強ノート」を作るつもりで、自分が新たに知ったことを書き留めていきます。
この試験、内容は大きく分けて次の3つです。
①ストラテジ(経営戦略)系
②マネジメント(管理)系
③テクノロジ(IT技術)系
シラバスの順に従って、今回は、
① ストラテジ(経営戦略)系
> 2. 業務分析・データ利活用
> (3) データ利活用
> -1 データの種類及び前処理
の勉強ノートです。
項目中の★印は、現時点での最新版(2024年10月試験)で導入されたことを表します。
シラバス掲載ページはこちら↓
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
◾️今回の解説項目
今回の項目のシラバスの内容は次の通りです。
説明不要と判断したいくつかを除き用語例・活用例としてあげられた概念に解説をつけていきます。
(3) データ利活用
・データを分析して利活用することによる,業務改善や問題解決
① データの種類及び前処理
・データを集める目的,集めるデータの種類及び特徴
・データ利活用のための簡単な前処理
★機械判読可能なデータの作成,表記方法
[用語例]
調査データ・実験データ
人の行動ログデータ・機械の稼働ログデータ
GIS デ ータ
量的データ・質的データ
1 次データ・2 次データ
メタデータ
構造化デ ータ・非構造化データ
時系列データ
クロスセクションデータ
[活用例]
データのサンプリング
データの名寄せ
データの外れ値・異常値・欠損値の処理
アノテーション
データの季節調整・移動平均
自然言語処理
画像処理
(3) データ利活用
・データを分析して利活用することによる,業務改善や問題解決
-1 データの種類及び前処理
・データを集める目的,集めるデータの種類及び特徴
・データ利活用のための簡単な*前処理
★機械判読可能なデータの作成,表記方法
[用語例]
調査データ・実験データ <省略>
人の行動ログデータ
機械の稼働ログデータ
GIS デ ータ
量的データ・質的データ
1 次データ・2 次データ
メタデータ
構造化デ ータ・非構造化データ
時系列データ
クロスセクションデータ
[活用例]
データのサンプリング
データの名寄せ
データの外れ値・異常値・欠損値の処理
アノテーション
データの季節調整・移動平均
自然言語処理
画像処理
⬜︎ 終わりに
いかがだったでしょうか。
私は、外れ値や欠損値に重要な意味があることがある、という点が勉強になりました。
また、最後に出てきた「アノテーション」は初めて出会った言葉でした。そして、このタグづけされたデータのことを「教師データ」と呼ぶことも初めて知りました。機械学習にとっては不可欠ななので、そういう概念があることはわかっていましたが、ネーミングを知らないとテストで答えられません。
概念はわかっていても名前がわからないというと、海外から日本に移住してきた学生、いわゆる渡日生のみなさんが理科や家庭科の勉強に苦労していたことと重なります。Nのことを知っていても、それを窒素と呼ぶことを知っていないとテストで答えられないのです。
中国語では窒素をなんと言うか、ChatGPTに尋ねてみました。
その答えは…
次回は、
①「ストラテジ(経営戦略)系」
>「2. 業務分析・データ利活用 」
>(3) データ利活用
>-2 データ分析における統計情報の活用
についての予定です。