第4次産業革命(5G,ビッグデータ,パーソナルデータ,構造化・非構造化データ,データサイエンス,データマイニング,テキストマイニング,AI)

◆第4次産業革命

ビッグデータ・AI・IoT等による技術革新による産業革命。

大量のデータを自動収集・連携・解析・活用することで新たな価値を生み出す、データ同士の繋がりによる産業革命。

超スマート社会の実現の可能性がある。


◆超スマート社会(Society 5.0)

狩猟社会・農耕社会・工業社会・情報社会に続く、人間中心の社会。Society5.0とも呼ばれる。

AIやIoT等の技術を生活分野にも広げることで、国籍・性別・年齢 等に関わらず必要な時に必要なモノ・サービスを享受でき、個人が快適に暮らせる社会を指す。


◆SDGs

Sustainable Development Goals。持続可能な開発目標。

地球環境を保護しながら全ての人が貧困を脱し、平和で豊かに暮らせるような世界を目指すための各種の目標のこと。

Society5.0や第4次産業革命にも関わる。


◆第1~3次産業革命

第1次産業革命:蒸気機関による機械化に代表される

第2次産業革命:電力や分業による大量生産に代表される

第3次産業革命:電子工学・コンピュータ・ロボット技術による自動化に代表される


◆5G

5 Generation。第5世代移動通信システムのこと。

「超高速」「低遅延」「多数同時接続」等の特徴を持つ。

2020年から順次、国内でサービス開始している。


総務省による「超高速」「低遅延」「多数同時接続」の内容。

超高速:通信速度10Gbps。(2時間の映画を3秒でダウンロード 等)

低遅延:利用者が遅延を意識することがなくなる。(医療ロボットの精緻な操作をオンラインで実現 等)

多数同時接続:身の回りのあらゆる機器がネットに接続する(自宅部屋内の100個以上の端末・センサがネットに接続 等)


◆ビッグデータ

多種多様で高頻度に更新される大量のデータのこと。

例:サーバのログ・売り上げデータ・購入履歴・GPS位置情報・RFID情報・SNSコメント・電子メール・動画・センサ情報 等、

「オープンデータ」「M2Mデータ」「パーソナルデータ」に大別される。


◆オープンデータ

機械判読に適した(人手を多くかけず利用できる)データ形式で、2次利用が可能な利用ルールで用意されたデータ。

平たく言えば、ルールの範囲内であれば、誰でも自由に複製・加工・再配布できるデータのこと。

商用としても利用可能。

政府 等が保有し、広く公開されているものもある。


◆M2Mデータ

Machine to Machineデータ。

機械が機械を制御する。

(例:自動車や道路上の機械装置が相互通信し、車両を制御する自動運転)


◆パーソナルデータ

個人の属性・行動特性・購買履歴 等の個人データ。

個人情報保護法で保護される情報のほか、匿名加工情報も含まれる。


匿名加工情報:特定の人が識別できないようにする匿名加工したデータ。一定のルールの下で本人の同意を得ることなく目的外利用や第三者提供が可能になっている。


◆PDS

Personal Data Store。

個人情報保護と企業活動の活性化を両立させるための取組みのひとつ。

個人情報を自分で管理し、自分の意思で第三者に提供することと引き換えに、個人にもメリットを得られるという仕組み。


◆情報銀行

個人情報保護と企業活動の活性化を両立させるための取組みのひとつ。

行動履歴・購買情報・医療情報 等の個人にひも付いたITデータを、個人から預託され、他の事業者とのマッチングや匿名化したうえでの情報提供、一元管理する制度、あるいは事業者を指す。


◆構造化データ・非構造化データ

構造化データ:関係DBで扱えるデータ。データが「項目」別で定型化されているもの。

非構造化データ:定型化されていないもの。写真や電子メール 等。


非構造化データを扱うには、付随する「メタデータ」を活用する。

メタデータ:データのためのデータ。データを表す属性や関連情報を記述したデータ。

メタデータ例:文書データに対してはタイトル、著者名、作成日 等。多くのファイル形式では、ファイルの先頭にメタデータを格納する領域が用意されており、決められた形式で保管できるようになっている。


◆データサイエンス

幅広く集めたビッグデータを、数学・統計的に処理したり、分析したりすることで新たな価値を生み出そうとするもの。


◆データマイニング

大量のデータをコンピュータによって解析し、「隠れた規則」「相関関係」等の有用な知見を得ること。

miningは「発掘」の意味。

自然言語の解析・パターン認識・人工知能の研究 等でも利用される。

「バスケット分析」「テキストマイニング」はデータマイニングのひとつ。


◆バスケット分析(データマイニングのひとつ)

よく一緒に購入される商品を分析すること。


◆テキストマイニング(データマイニングのひとつ)

文字情報を対象とし、キーワード同士の関連や出現傾向 等を解析するもの。


◆PPDACサイクル

統計を使った問題の発見~解決までのフレームワーク。

Problem(問題設定)、Plan(調査の計画)、Data(データ)、Analysis(分析)、Conclusion(結論)の頭文字。

データに基づき、現象を中立・公正に捉えて、客観的な分析を行っていく解決プロセス。


◆AI(人工知能)

人間にしか出来なかったような高度に知的な作業や判断を、コンピュータを中心とする人工的なシステムにより行えるようにしたもの。

ただし、人類は未だに人間の脳の振る舞いや知能の仕組みを完全には解明していないため、人工知能にも明快な定義は与えられていない。


◆AIの発展

初期のAI研究では対象についての知識・ルール・判断基準 等を人間がプログラムの一部として直に記述する手法が一般的だった。(ルールベースAI)

ルールベースAI:過去、AIとされていたもの。「もしAならばBの処理」のように、人がルールを考えてコンピュータに教え込むタイプのAI。

しかし、ルールベースAIでは人間レベルの判断を下せるシステム実現には途方もない時間・コストが必要になる。

この問題を打ち破るため、人間は学習の仕方だけをプログラムとして実装し、与えられた大量のデータを自動処理するという「機械学習」の手法が考案された。


また、人工知能の一部として研究・開発が進められていたものが、技術の成熟による実用化・普及が進むと、人工知能と呼ばれなくなり、より高度で研究途上のものが新たに人工知能として注目される傾向がある。

この現象は「AI効果」と呼ばれ、例として「文字認識技術」「検索エンジン」「ロボット掃除機」等がある。ルールベースAIが多く該当する。


2000年代 後半以降に人工知能とされるものは、大量のデータから規則性やルール 等を学習し、与えられた課題に対して「推論」「回答」「情報の合成」 等を行う「機械学習(Machine Learning)」が主流。

特に、人間の神経回路を模した「ニューラルネットワーク」で、深い階層のモデルを構築し、精度の高い推論を行うディープラーニング(深層学習)研究に大きな進展があり、これに基づく研究や開発が盛んになっている。


◆現在「AI」とされるものを活用したシステム例

チェス・将棋等の「知的なゲームで対局するシステム」

画像や映像に映る物体・人物を識別する「画像システム(コンピュータビジョン)」

人間の発話を聞き取って内容を理解する「音声認識システム」

言葉を組み立てて声として発する「音声合成システム」

ロボットや自動車 等での「機械の高度で自律的な制御システム」

高度で自然な機械翻訳といった様々な「自然言語処理システム」


◆機械学習

コンピュータプログラムに、ある分野のデータを繰り返し与えることで、内在する規則性等を学習させ、未知のデータが与えられた際に、以前の学習結果に当て嵌めて「予想」「判断」「分類」等を行えるようにする仕組み。

ビッグデータをコンピュータに解析させ、コンピュータ自らが予測・判断できるようにする。

現代のAI研究における最も有力な方法。


機械学習の具体的な方式には「SVM(サポートベクターマシン)」「ベイジアンネットワーク」「決定木(デシジョンツリー)学習」「データクラスタリング」「ニューラルネットワーク」 等がある。

現在は人間の脳の神経回路の網状の繋がりに着想を得た「ニューラルネットワーク」が台頭している。


◆教師あり学習(機械学習の手法のひとつ)

「例題」「答え」という形式に整理された「教師データ」に適合するよう、モデルを構築していく手法。

例題を入力すると、対応する答えを出力するようにモデルを調整していく。


人間が既に答えを知っているような判断・作業を自動化したい場合に有効な手法で、応用範囲も広い。

ただし「教師データ」は「例題」「答え」という形式に人の手によって整理しなければならない。

学習データの質や潜在的な問題点が、そのまま精度や結果に反映されてしまう難点もある。


◆教師なし学習(機械学習の手法のひとつ)

人間が基準や正解を与えずに学習データを分析させ、システムが自律的に何らかの規則性や傾向を見出す手法。

与えられたデータ群を何らかの目的をもって解析し、特徴の似たデータのグループ分け等 を行えるようにする。

人間にも正解が分からない課題についての知見を得たい場合や、大量のデータから規則性を探索したい場合などに有効な手法。

データの前処理が少なく、現実世界にある様々なデータを素材に出来る。

ただし、結果が何を意味するかは、人間による解釈が必要で、人間にとって有用な結果が得られるよう制御するのが難しく、精度も安定させにくい。


◆強化学習(機械学習の手法のひとつ)

システムの行動に対して評価(報酬)が与えられ、行動の試行錯誤を繰り返し、評価を最大化する行動パターンを学習させる手法。

機械の制御・競技・ゲーム 等を行うAIの訓練に適している。

他の学習手法と異なり、人間がまとまった形で学習データを与えることはせず、システムは「現在の状況を入力」として行動を選択する。

行動の結果は、評価(値)としてシステムに伝達され、どのような行動が好ましい結果に繋がるかを繰り返し試行錯誤しながら学習していく。


◆ディープラーニング(機械学習の手法のひとつ)

DNNに基づく機械学習のこと。深層学習とも呼ばれる。

ニューラルネットワーク階層を4層以上にしたディープニューラルネットワーク(DNN:Deep Nueral Network)が目覚ましい発展を遂げ、機械学習の研究・開発での中核として注目されるようになった。


◆サイバーフィジカルシステム(CPS)

Cyber Physical System。

生産設備やサプライチェーンといった物理世界の情報をコンピュータシステムに集約・分析・処理を行い、制御や管理などの形で物理世界(フィジカル)にフィードバックするシステムのこと。

要素技術として「無線センサネットワーク(WSN:Wireless Sensor Network)」「IoT」「ビッグデータ解析」「機械学習」「クラウドコンピューティング」「オートメーション(自動化)」「ロボティクス(機械制御)」 等がある。


◆デジタルツイン

仮想空間に、物理的な実態とリアルタイムで連動する「双子」をつくる方法。

例:プラントにおける、運転状況の監視・AI学習による最適な運転方法学習における運転支援 等。


この記事が気に入ったらサポートをしてみませんか?