tk.tatsuro

システムエンジニア #Python #Node.js #AWS #Data scien…

tk.tatsuro

システムエンジニア #Python #Node.js #AWS #Data science #Machine learning

最近の記事

クラスタリングについて

この記事の狙い・目的 機械学習を取り入れたAIシステムの構築は、 ①データセット作成(前処理)→ ②モデルの構築 → ③モデルの適用 というプロセスで行っていきます。 その際「データセット作成(前処理)」の段階では、正しくモデル構築できるよう、事前にデータを整備しておくことが求めらます。 このブログでは、その際「特徴量エンジニアリング」として用いられることの多い「クラスタリング」手法と、またその手法を用いて行う「特徴量生成」について解説していきます。 プログラムの実行環境P

    • 主成分分析について

      この記事の狙い・目的機械学習を取り入れたAIシステムの構築は、 ①データセット作成(前処理)→ ②モデルの構築 → ③モデルの適用 というプロセスで行っていきます。 その際「データセット作成(前処理)」の段階では、正しくモデル構築できるよう、事前にデータを整備しておくことが求めらます。 このブログでは、その際に問題なることが多い、「次元の呪い」やその対処方法となる「主成分分析(次元削減)」について解説していきます。 主成分分析とは主成分分析とは、あるデータ群をより少ないデー

      • 不均衡データについて

        記事の狙い・目的機械学習を取り入れたAIシステムの構築は、 ①データセット作成(前処理)→ ②モデルの構築 → ③モデルの適用 というプロセスで行っていきます。 その際「データセット作成(前処理)」の段階では、正しくモデル構築できるよう、事前にデータを整備しておくことが求めらます。 このブログでは、その際に問題なることが多い、「不均衡データ」とその対処方法について解説していきます。 プログラム等の実行環境Python3 MacBook pro(端末) PyCharm(IDE

        • 外れ値検出について

          この記事の狙い・目的機械学習を取り入れたAIシステムの構築は、 ①データセット作成(前処理)→ ②モデルの構築 → ③モデルの適用 というプロセスで行っていきます。 その際「データセット作成(前処理)」の段階では、正しくモデル構築できるよう、事前にデータを整備しておくことが求めらます。 このブログでは、その際に問題なることが多い、「外れ値」とその対処方法について解説していきます。 プログラム等の実行環境Python3 MacBook pro(端末) PyCharm(IDE)

        クラスタリングについて

          欠損データについて

          この記事の狙い・目的機械学習を取り入れたAIシステムの構築は、 ①データセット作成(前処理)→ ②モデルの構築 → ③モデルの適用 というプロセスで行っていきます。 その際「データセット作成(前処理)」の段階では、正しくモデル構築できるよう、事前にデータを整備しておくことが求めらます。 このブログでは、その際に問題なることが多い、データの「欠損」とその対処方法について解説していきます。 欠損データとは欠損データとは、なんらかの原因により、データの取得、登録ができなかったデー

          欠損データについて