マガジンのカバー画像

Dentsu Digital - データサイエンス -

23
運営しているクリエイター

#テックブログ

Amazon SageMaker CanvasとDataRobotを比較してみた

概要こんにちは。電通デジタルでデータサイエンティストをしている中嶋です。 昨年11月にAWSか…

非劣性検定を用いたA/Aテストの方法

電通デジタルでデータサイエンティストをしている中嶋です。本記事は電通デジタルアドベントカ…

AIを理解する技術ーSHAPの原理と実装ー

電通デジタルでデータサイエンティストをしている福田です。 これはDentsu Digital Advent Cal…

SQLでAUCを算出する方法

電通デジタルで機械学習エンジニアをしている今井です。 Advent Calendar 9日目となる本記事で…

BigQuery MLで共変量シフト分析

電通デジタルで機械学習エンジニアをしている今井です。 本記事では、BigQuery MLで共変量シフ…

CATE推定のためのCausal Treeの仕組み

この記事について 電通デジタルでデータサイエンティストをしている中嶋です。この記事では統…

統計的仮説検定における多重検定の問題とその対処法

この記事について電通デジタルでデータサイエンティストをしている中嶋です。この記事では統計的仮説検定における多重検定の問題を扱い、その対処法について簡単な手法を紹介します。統計的仮説検定についてある程度知っていることを前提としていますが、もし忘れてしまったり、自信が無い方は前回の記事の復習を先にご覧いただくことをお勧めします。 多重検定とは多重検定の問題 統計的仮説検定は、予め決めた有意水準に対してデータから算出したp値を用いて大小を評価し、帰無仮説の棄却もしくは採択(保留)

SageMaker Clarifyで特徴量重要度を出力する

電通デジタルで機械学習エンジニアをしている今井です。 本記事では、SageMaker Clarifyで特徴…

統計的仮説検定における効果量の概念と必要サンプルサイズの算出

この記事について電通デジタルでデータサイエンティストをしている中嶋です。今回の記事では統…

pLTV: 顧客生涯価値を予測する

電通デジタルで機械学習エンジニアをしている今井です。 本記事では、顧客生涯価値を予測する…

広告セグメントをfastTextとMagnitudeを使ってマッピングする

電通デジタルでデータサイエンティストを務めている荒川です。広告領域を中心にデータ系のプロ…

SageMakerで独自アルゴリズムを使う

電通デジタルで機械学習エンジニアをしている今井です。 本記事では、SageMaker独自アルゴリズ…

SageMakerで学習したXGBoostモデルのFeature Importanceを取得するAirflowオペレータ…

電通デジタルでデータサイエンティストとして働いている長島です。 本記事ではSageMakerで学…

SageMaker Processingで独自アルゴリズムを使う

電通デジタルで機械学習エンジニアをしている今井です。 本記事では、「SageMakerで独自アルゴリズムを使う」で紹介した libsvm-converter をSageMaker Processingで使う方法について紹介します。 Amazon SageMaker Processingとは Amazon SageMaker Processingは2019年12月にリリースされたサービスで、機械学習のためのデータ前処理などをバッチで実行するためのインフラ環境を提供します。 A