マガジンのカバー画像

Pythonコード集

12
統計・機械学習の学習等に利用したPythonのコード集。実用的なコード作りを目指して頑張ります。
運営しているクリエイター

記事一覧

Python: Plotlyを用いた記述統計の手法①

Python: Plotlyを用いた記述統計の手法①

日経ソフトウェア2022年9月号に載っていた、Plotlyを用いた記述統計の手法を自分用のメモとして記事にして見ました。

データの内容を確認pip install plotlyimport pandas as pdimport plotly.express as pxdf = pd.read_csv("baseball_players.csv")#データの行の内容と形状を確認する#内容は架空のプ

もっとみる
回帰問題を解く際のセオリー(SKLearn, カルフォルニアの住宅価格の予測)

回帰問題を解く際のセオリー(SKLearn, カルフォルニアの住宅価格の予測)

SkLearnについているfetch_california_housingという、カルフォルニアの住宅価格の実データをもとに機械学習の回帰問題を解く際のセオリー全般というのを私なりに考案してみました。

機械学習において、教師あり回帰問題を解く目的は以下の3つです。

1、既知の説明変数に対して未知の目的関数を求めることができる、できるだけ正確なモデルを作成する。
2、モデルの作成が完了したらその

もっとみる
Python Pro Bootcamp、27日目 Tkinterの基礎 + アーギュメントの使い方

Python Pro Bootcamp、27日目 Tkinterの基礎 + アーギュメントの使い方

今日はGUIで動くプログラムを作りたいと考え、Tkinterを使ったプログラムの基礎、およびアーギュメントの効率的な使い方を学習しました。Tkinterを使ったプログラムの作成は全3篇になっていますので、この調子で頑張りたいと思います。

Tkinterの基礎#TkinterでGUIを用いたプログラムを作成するimport tkinter as tkfrom tkinter import *fro

もっとみる
Python Pro Bootcamp、26日目 - リスト・ディクショナリーの効率的な使い方

Python Pro Bootcamp、26日目 - リスト・ディクショナリーの効率的な使い方

リスト・ディクショナリーの効率的な使い方len(), split()などのstring型の処理を活用して効率よくリスト・ディクショナリー型のデータを処理する方法を学習しました。
#リストのより効率的な扱い方を学習する 。内包表記について#リストに含まれている要素分だけ何らかの処理を行いたい場合は、内包表記を使うと便利numbers = [1,2,3]new_numbers = [ n+1 for

もっとみる
Python Pro Bootcamp、25日目 - Pandasの基礎(統計とデータサイエンス)

Python Pro Bootcamp、25日目 - Pandasの基礎(統計とデータサイエンス)

久々に学習を再開しました。
どうせなら実用的で関心のあることに取り組みたいと考えたので、
いっそつまらないコースを飛ばして「楽しそうだなあ」と思ったことにのみ取り組むようにしています。

今日はPandasの基礎を学びました。
Pandasは主にcsvファイル等の2次元データの処理に使われるライブラリーです。統計量を抽出したり、データから特定の要素を検索して分析したい時に有効なのでデータサイエンス

もっとみる
Pythonでお題メーカーを作成してみた

Pythonでお題メーカーを作成してみた

キャラクターで創作・絵描きをしたい人向けにPythonを使ったお題メーカーを作ってみました。GUIを使ったり、Djangoでアプリにする等お題メーカーのアイデアをこれから発展させていきたいと考えています。
#キャラクターの属性をランダムにチョイス 、リストから抽出して1つの文章にするいわば「お題メーカー」を作成するimport randomrace_list = ["犬科","猫科","兎目","

もっとみる
文章のWordCloudと共起ネットワークを作成するPythonコード

文章のWordCloudと共起ネットワークを作成するPythonコード

これから記事制作の一環として文章を自然言語処理で解析→視覚化して分かりやすくする、という工程を入れたいと考え自分用のメモも兼ねWordCloud・共起ネットワークの作り方をまとまったコードにして見ました。

WordCould形態素解析にMecabを、例文にWikipediaのソクラテスの記事を使ってます。
実行環境は最新版のAnaconda + JupyterNotebookです。

impor

もっとみる
Pythonコードの復習(5) - Tensorflow + Keras、CNNを用いたCIFAR-10の多値分類

Pythonコードの復習(5) - Tensorflow + Keras、CNNを用いたCIFAR-10の多値分類

今回は、CIFAR-10というデータセットを畳み込みニューラルネットワーク(CNN, Convolutional Neural Network)を用いて多値分類する方法を考案して実践してみました。

Cifar-10は50000枚の訓練データ、10000枚の学習データに分かれたデータセットであり、飛行機、鳥、猫、鹿、犬、蛙、馬、船、トラックの10つの異なる物体(説明変数)がそれぞれラベル(目的変数

もっとみる
Pythonコードの復習(4) - Tensorflow + Keras、データの整形 & ニューラルネットワークを用いたペンギンの多値分類

Pythonコードの復習(4) - Tensorflow + Keras、データの整形 & ニューラルネットワークを用いたペンギンの多値分類

今回は、前回に引き続き機械学習の基礎であるニューラルネットを用いた多値分類、およびデータを学習に掛けるための整形の仕方について考察していきたいと思います。

今回学んだことIrisデータとペンギンデータ多値分類の例題として有名なIris データは著名な統計学者であるロナルド・フィッシャーによって集計されましたが、このデータは「優生学年鑑」("Annals of Eugenics")という現在では疑

もっとみる
Pythonコードの復習(3) - Tensorflow + Keras、ニューラルネットワークを用いた2値分類

Pythonコードの復習(3) - Tensorflow + Keras、ニューラルネットワークを用いた2値分類

今回は、機械学習の基礎であるニューラルネットを用いた2値分類について学習をしてみました。
E検定の学習と「Tensorflow2 プログラミング実装ハンドブック」という本を参考に、正規分布に従うクラスターを2つに分類するという簡単な問題に挑戦してみます。

モデルの考案
順伝播・逆伝播ができるニューラルネットをTensorflow・Kerasを用いて実装します。訓練・テストに用いるデータの分割、お

もっとみる
Pythonコードの復習(2) - Numpyの行列の初期化について

Pythonコードの復習(2) - Numpyの行列の初期化について

E資格の学習の一環として、Pythonそのものの組み込み関数の他Numpy, Pandas, Matplot, SKLearn等々のライブラリーの使い方を復習しています。今回は「Python科学技術計算」という本の内、行列データの初期化の学習が終わったのでここにメモを残しておきます。

今回学習したことのリスト行列の初期化np.zeros

要素が全て0の行列を作成。行数、列数を順に指定する

もっとみる
Pythonコードの復習(1) - 組み込み関数、Numpyの行列処理について

Pythonコードの復習(1) - 組み込み関数、Numpyの行列処理について

E資格の学習の一環として、Pythonそのものの組み込み関数の他Numpy, Pandas, Matplot, SKLearn等々のライブラリーの使い方を復習しています。今回は組み込み関数とNumpyの復習が終わったのでその使用例を掲載しておきます。

Pythonの組み込み関数zip

for文を使って複数のイテラブル(list)から同時に要素を取り出す
#zip - for文を使って複数のイ

もっとみる