東京ジバニャン

◆勤務先 銀行 企業内データサイエンティストが目標 ◆国立大法学部卒 ◆福岡県出身  …

東京ジバニャン

◆勤務先 銀行 企業内データサイエンティストが目標 ◆国立大法学部卒 ◆福岡県出身  ◆東京都在住 ◆pythonプログラミング初心者 2022年〜 ◆趣味 将棋、iPad、Mac、トレイルラン ◆資格 G検定/pythonエンジニア認定試験(基礎・データ分析)/ITパスポート

記事一覧

【実装】Python機械学習〜実践的前処理〜

本日は機械学習工程のうち、前処理について少し深く学んでみた。 ▪️欠損値の処理 ・線形補間(df[列名].interpolate()):時系列データの場合に有用。  欠損値の前後の…

RとPython

本日「R」についての勉強会に出席しました。話を要約すると次の通りでした。 1.プログラミング言語「R」の特徴 ◾️データ集計・分析に特化 ・データ分析に必要なあらゆ…

6

pandas復習(超入門編)

機械学習のコーディングを本格的に開始してから約1ヶ月。まだまだkaggleやsignateのコンペ参戦までの道のりは遠く感じる。特にpandasの基礎知識が不足しているため、今日…

毎日pyhon スッキリわかる機械学習

◾️第5章 分類1 アヤメの判別 ・アヤメの花を分類〜データの前処理〜モデル作成・学習・評価を実施 ・モデルの作成には、tree.DecisionTreeClassifier関数を使用。 ・…

「企業内データサイエンティスト」を目指して

新年度を迎えるにあたり目標を設定。イメージを持つことを大切に。。。 キャリアアップ実現を目指してあらたなスタートを切ろう。 24年度(前半イメージ) 4月  pyth…

1
【実装】Python機械学習〜実践的前処理〜

【実装】Python機械学習〜実践的前処理〜

本日は機械学習工程のうち、前処理について少し深く学んでみた。

▪️欠損値の処理
・線形補間(df[列名].interpolate()):時系列データの場合に有用。
 欠損値の前後のデータに対して直線を引いて、欠損しない本来の値を予測する
 ことを線形補間と呼ぶ。
 interpolateメソッドは引数がオブジェクト型だと補間しないため、その仕様に
 合わせて、データの型を事前に変更する必要がある

もっとみる
RとPython

RとPython

本日「R」についての勉強会に出席しました。話を要約すると次の通りでした。

1.プログラミング言語「R」の特徴

◾️データ集計・分析に特化
・データ分析に必要なあらゆる解析手法をカバー
◾️関数型言語で簡単なコードを記述できる
・簡潔なコードで高度な分析手法を実行可能
◾️データ分析・機会学習のためのライブラリが豊富
・相関・回帰分析などの基本的な集計から、時系列やクラスタリングなどの
 高度な

もっとみる
pandas復習(超入門編)

pandas復習(超入門編)

機械学習のコーディングを本格的に開始してから約1ヶ月。まだまだkaggleやsignateのコンペ参戦までの道のりは遠く感じる。特にpandasの基礎知識が不足しているため、今日は、「スッキリわかるpythonによる機械学習」の第4章、でpandasの超入門編の復習を行なった。

▪️データフレームの作成
変数名=pd.DataFrame(2次元のデータ、index=インデックスのリスト、colu

もっとみる
毎日pyhon  スッキリわかる機械学習

毎日pyhon スッキリわかる機械学習

◾️第5章 分類1 アヤメの判別
・アヤメの花を分類〜データの前処理〜モデル作成・学習・評価を実施
・モデルの作成には、tree.DecisionTreeClassifier関数を使用。
・決定木の図の作成
  scikit-learnの関数plot_treeを用いた描画関数が大変参考になりました。

◾️第6章 回帰1 映画の興行収入の予測
・過去のデータから売上げを予測する。
・最小二乗法の

もっとみる
「企業内データサイエンティスト」を目指して

「企業内データサイエンティスト」を目指して

新年度を迎えるにあたり目標を設定。イメージを持つことを大切に。。。
キャリアアップ実現を目指してあらたなスタートを切ろう。

24年度(前半イメージ)
4月  pythonスタートブック[増補改訂版](技術評論社)
    →pythonの基本項を復習
    「スッキリわかる pythonによる機械学習」(インプレス)
5月  東京大学のデータサイエンティスト育成講座(マイナビ)
    データ

もっとみる