東京ジバニャン

◆勤務先 銀行 企業内データサイエンティストが目標 ◆国立大法学部卒 ◆福岡県出身  …

東京ジバニャン

◆勤務先 銀行 企業内データサイエンティストが目標 ◆国立大法学部卒 ◆福岡県出身  ◆東京都在住 ◆pythonプログラミング初心者 2022年〜 ◆趣味 将棋、iPad、Mac、トレイルラン ◆資格 G検定/pythonエンジニア認定試験(基礎・データ分析)/ITパスポート

最近の記事

【実装】Python機械学習〜実践的前処理〜

本日は機械学習工程のうち、前処理について少し深く学んでみた。 ▪️欠損値の処理 ・線形補間(df[列名].interpolate()):時系列データの場合に有用。  欠損値の前後のデータに対して直線を引いて、欠損しない本来の値を予測する  ことを線形補間と呼ぶ。  interpolateメソッドは引数がオブジェクト型だと補間しないため、その仕様に  合わせて、データの型を事前に変更する必要があるので注意を要する。  (例)object型からfloat型に変更。 ・欠損値のあ

    • RとPython

      本日「R」についての勉強会に出席しました。話を要約すると次の通りでした。 1.プログラミング言語「R」の特徴 ◾️データ集計・分析に特化 ・データ分析に必要なあらゆる解析手法をカバー ◾️関数型言語で簡単なコードを記述できる ・簡潔なコードで高度な分析手法を実行可能 ◾️データ分析・機会学習のためのライブラリが豊富 ・相関・回帰分析などの基本的な集計から、時系列やクラスタリングなどの  高度な手法まで対応 2.参考になったこと ・プログラミング言語どれか一つでも習得で

      • pandas復習(超入門編)

        機械学習のコーディングを本格的に開始してから約1ヶ月。まだまだkaggleやsignateのコンペ参戦までの道のりは遠く感じる。特にpandasの基礎知識が不足しているため、今日は、「スッキリわかるpythonによる機械学習」の第4章、でpandasの超入門編の復習を行なった。 ▪️データフレームの作成 変数名=pd.DataFrame(2次元のデータ、index=インデックスのリスト、columns=列名のリスト) ▪️行数や列数を調べる df.shape ▪️列名・イ

        • 毎日pyhon スッキリわかる機械学習

          ◾️第5章 分類1 アヤメの判別 ・アヤメの花を分類〜データの前処理〜モデル作成・学習・評価を実施 ・モデルの作成には、tree.DecisionTreeClassifier関数を使用。 ・決定木の図の作成   scikit-learnの関数plot_treeを用いた描画関数が大変参考になりました。 ◾️第6章 回帰1 映画の興行収入の予測 ・過去のデータから売上げを予測する。 ・最小二乗法の概要を改めて学び直した。 ・重回帰モデルの作成には、モデル変数LinearReg

        【実装】Python機械学習〜実践的前処理〜

          「企業内データサイエンティスト」を目指して

          新年度を迎えるにあたり目標を設定。イメージを持つことを大切に。。。 キャリアアップ実現を目指してあらたなスタートを切ろう。 24年度(前半イメージ) 4月  pythonスタートブック[増補改訂版](技術評論社)     →pythonの基本項を復習     「スッキリわかる pythonによる機械学習」(インプレス) 5月  東京大学のデータサイエンティスト育成講座(マイナビ)     データサイエンスハンドブック(オライリー社) 6月 「kaggleのデータ分析」(翔泳

          「企業内データサイエンティスト」を目指して