見出し画像

『Pythonデータ解析入門』 第1章 データ解析を学ぶ

情報端末・機器,インターネット,ウェブなど情報通信技術の発展と普及によりさまざまなデータが生み出され,その量は爆発的に増加しています.特に,膨大で多様なデータはビッグデータと呼ばれ,それらのデータを処理・分析し,データから価値を創造するための技術であるデータサイエンスの重要性が高まっています.

(データサイエンスのスキルを備えた人材をデータサイエンティストと呼びます.データサイエンティストは,数学,計算科学,統計学を土台にして,専門家と適切にコミュニケーションを図りながらデータを分析し,分析結果を意思決定者に対してわかりやすく伝え問題解決を支援します.).

データサイエンスにおいて,データ解析はデータに潜む規則や構造を捉えるためのさまざまな手法を提供し,そこから得られた結果を適切に解釈することでデータに基づいた問題解決や意思決定の支援を行うことを可能にします.

本書では,データ解析の基礎となる代表的な手法(本書で学ぶデータ解析の手法は,多変量解析,データマイニング,機械学習などの関連分野にも共通する基礎的な手法になっています.)について,それらの数理的背景も含めて理解するとともに,Pythonプログラミング言語を用いてそれらの手法を実際に手を動かしながら実装することで理解を深めます.

これにより,数理的知識にしっかりと裏打ちされた骨太で真に応用力のあるデータ解析の基本的なスキルを習得することを目指します.本書の読者として,大学初年次・2年次の数学基礎を学んだことのある高等教育機関の学生ならびに社会人を想定しています.

本書は全13章からなります.各章の内容は以下のとおりです.

  • 第1章では,データ解析の概要および本書の学習の進め方や学修目標について確認します.

  • 第2章では,Pythonプログラミング言語の基礎を学びます.

  • 第3章では,データ解析において用いられることの多いPythonの代表的なモジュールとして,NumPy, pandas, matplotlibの各モジュールの使い方について学びます.

第2章と第3章で学習する内容は,以降の各章のプログラミング演習の基礎となるものです.

  • 第4章では,データ解析の基礎として,データの基本的な表現およびデータの収集から前処理までの一連の基本的な処理について学びます.

  • 第5章では,テキストデータを例として,データのベクトルによる表現と演算に基づく基本的な処理について学びます.

  • 第6章では,データの関係を表したネットワークデータを例として,データのベクトルと行列による表現と演算に基づく基本的な処理について学びます.

第5章と第6章で学習するベクトルや行列によるデータの表現と処理は,以降の各章の内容であるデータ解析の具体的な各手法の基礎となるものです.第6章までに学んだ内容を基礎として,以降まず

  • 第7章では,データ解析に用いられる機械学習の基本となる考え方について学びます.

  • 第8章では,類似した特徴を持つデータをまとめてグループ分けを行うための手法であるクラスタリングについて学びます.

  • 第9章では,データの圧縮や可視化に応用することができる次元削減の手法の1つとして主成分分析について学びます.

第8章と第9章で学ぶクラスタリングと主成分分析は,機械学習の教師なし学習のタスクに利用することができます.

  • 第10章では,機械学習の教師あり学習のタスクのうち,入力に対して連続値を予測する回帰のタスクの基礎となる手法である線形回帰について学びます.

  • 第11章では,機械学習のモデル選択の基礎について学びます.

  • 第12章では,教師あり学習のタスクのうち,入力に対して離散値を予測する分類のタスクの基礎となる手法であるロジスティック回帰について学びます.

  • 最後に第13章では,ニューラルネットワークの基礎について学びます.

この記事が気に入ったらサポートをしてみませんか?