見出し画像

『Pythonデータ解析入門』 第5章 テキストデータ分析の基礎

本章では,テキストデータ分析の基礎について学びます.特にテキストデータを例として,データのベクトルによる表現と処理の方法について学びます.

まず,テキストデータについて概観した上で,テキストを分割する処理である分かち書きと形態素解析について学びます.次に,単語を特徴としてテキストをベクトルとして表現する方法を学びます.最後に,テキスト間の類似度をベクトルの演算に基づき計算することを学びます.

プログラミング演習では,実際のテキストデータを用いて,ベクトルとして表現したテキスト間の類似度を計算する処理を実装します.

本章の学習を通して,データ解析の基礎となるデータのベクトルによる表現とベクトルの演算に基づくデータの基本的な処理について理解し,実データに対してそれらの処理を実際に適用することができるようになることを目標とします.

  • 5.1 テキストデータ

  • 5.2 テキストの分かち書きと形態素解析

  • 5.3 テキストのベクトル表現

  • 5.4 テキストの類似度

  • 5.5 プログラミング

この記事が気に入ったらサポートをしてみませんか?