見出し画像

新卒データサイエンティストの振り返り

電通デジタルで見習いデータサイエンティストをしている横溝です。(勝手に見習いと自称しています。)
見習いと言っているのは、私が2022年に新卒で電通デジタルに入社し、データサイエンスに関わる仕事をこなすにはまだまだスキルが足りないと実感しているからです。
本記事では、新卒1年目が終了するというタイミングで自分への振り返りの意味を込めつつ、「電通デジタルで働く新卒1年目の(見習い)データサイエンティストがどのような生活を送ったのか」についてご紹介します。

本記事で伝えられないこと

本記事では、

  • 実際に案件として携わった企業名などの固有名詞

  • 電通デジタルでデータサイエンスに関わるお仕事をされている社員の紹介や全体観

に関しては、お伝えすることが出来ません。

本記事の想定読者と非想定読者

本記事を読んでいただきたい読者は下記の通りです。

  • データサイエンティストを目指している大学生や高校生

  • 電通デジタルで働く新卒データサイエンティスト社員の働き方が気になる皆さま

また、本記事をオススメ出来ない読者は下記の通りです。

  • 電通デジタルで働くデータサイエンティストの全体観を知りたい皆さま

  • 電通デジタルがどのようなお客様と関わっているのか知りたい皆さま

配属先の簡易的な説明

私が配属された部署は、デジタル広告領域においてデータを活用した取り組みに関する仕事を担う部署です。主に

  • デジタル広告領域での、データを活用したソリューション*¹の開発と運用

  • デジタル広告領域での、データを活用した施策の相談

  • ウェブサイト分析

などが業務として挙げられます。

※2 本記事での"ソリューション"とは、"ツール"のみに限らず"ツール"以外のビジネス課題を解決するための施策も含まれます。

入社前の状態

入社後の業務の話に入る前に、入社前の私の状態をお伝えします。学歴は

  • 高校 : 商業高校を卒業

  • 大学 : 福岡の私立大学商学部に入学

  • 大学のゼミ(少人数で教授と共に専門分野を学ぶスタイル) : 企業と連携し、企業のデータをお借りしてマーケティング戦略の考案と実行など

といったステータスでした。データサイエンスに関わる学びに関しては、

  • 統計学 : 大学の講義で学んだレベル

  • 機械学習 : 独学で学んだレベル

  • Kaggleなどには参加せず企業の長期インターンで予測モデル構築などの実施

  • データサイエンスに関わる勉強会に参加 & 発表し、データ分析のノウハウなどを蓄積

といったレベル感でした。
一方で「数学ゴリゴリやっていました」「Kaggleメダルとっています」「大学院で深層学習の研究していました」といった経験はなく、不安と闘いながら向上心が勝りデータサイエンスの道に進もうと決心しました。


入社後1年間の動き

ここから入社後(見習い)データサイエンティストとして働く私の生活を紹介します。時系列を簡単に表で表すと下記となります。

簡単にご説明しますと、

  • 入社後2ヶ月間 : 100人以上の同期と一緒に新卒研修

  • 新卒研修後 : 配属先でOJTがスタート

といった状況です。
OJTでは、所属部署が所持するソリューションの理解から始まり、私は主に"X-STACK"と名のついたソリューションを担当することになりました。その後、他ソリューションの開発と運用、サイト分析、図には示していないData Clean Roomを活用したプロジェクト、新卒採用に関わる業務をこなしていました。
次のセクションから時系列に沿って詳しくお話します。

4月 社会人デビューと新卒研修

2022年4月1日にオンラインで入社式があり、電通デジタルへ入社しました。私たちの年では電通デジタルと電通アイソバーが合併した為、電通デジタルと電通アイソバーの新入社員100名以上が同期となりました。
私はデータサイエンス選考で入社していた為、配属部署は決まっていました。しかし、多くの同期は一般選考で入社していた為、入社してすぐは職種とは無関係に同期全員で同じ研修を受けました。

研修内容はデータサイエンスとは無関係でした。主に1グループメンターとサブメンターと呼ばれる先輩社員2人と5~6人の同期で班が構成されており、

  • 電通デジタルの組織構成、Detsu Japan Networkについて理解する研修

  • ビジネス行動研修, ビジネスコミュニケーション研修

  • Web解析士の勉強 ※テキスト配布されました

などがあったと記憶しています。

5月 配属先領域別研修

4月の終わりに同期全員どの領域*²に配属されるか発表され、私はマーケティングコミュニケーション領域(MC領域)だった為、5月はMC領域の研修を受けました。MC領域研修では主に

  • MC領域内に存在する部門の理解

  • タグ業務に関する研修

  • Google研修, Meta Blue Print認定試験勉強, デジタル広告のデイリーレポートレクチャー

などがあったと記憶しています。

※2  当時はマーケティングコミュニケーション領域(デジタル広告やリテールメディアに関する領域)、トランスフォーメーション領域(コンサルティングに関する領域)、クリエイティブ領域(デジタル広告制作, SNS施策制作などクリエイティブに関する領域)、全社直轄領域事業戦略室(電通デジタル内部(広報, 開発etc..)に関する領域)と主に4領域でした。

6月初旬 OJTスタート

各月記事を書いていくと、終わらないことに気づきましたので、ここからは複数月で紹介していきます。

6月から私は、MC領域のソリューション戦略部のデータサイエンスグループ*³でOJT (On The Job Training)が始まり、データサイエンスに関わる仕事をしていきます。配属後すぐは

  • トレーナー(私の生活面や仕事面をサポートしてくれる先輩社員)と面談

  • 同グループの先輩社員に挨拶

  • 同グループに存在する複数のソリューションを調査

などと、自グループ理解から行いました。

※3 ソリューション戦略部は主にデジタル広告領域でのデータ活用を支援する部署です。その中のデータサイエンスグループはデータを活用したソリューション開発やソリューションの運用、データ活用施策の相談を担うグループです。

6月中旬 ~ 10月 案件へのアサイン & 社会人人生初のモデル構築

私の1年目の目標は、

  • ソリューション戦略部が所有するソリューション"X-STACK" をグループ内で任せてもらえる人材になること

と決めました。

X-STACKとは、お客様ウェブサイト内行動ログデータとお客様所有のファーストパーティデータを活用し、広告配信&運用を実現するソリューションです。X-STACKでは、デジタル広告運用において顧客のコンバージョンの有無(購入有無, 申込有無etc.. )ではなく、顧客のコンバージョンの質(売上金額, 成約度合etc..)を基に広告配信&運用を行います。
その為、6月中旬からはX-STACKを実施したい保険事業社様の、

  • 広告配信に活用するコンバージョンの質を予測するモデル構築

を行いました。
データサイエンスグループでは、データはGCP(Google Cloud Platform)のBigQueryで所持しています。その為、BigQueryを用いてモデル構築 & モデル評価 & 推論を実施しました。

SQLは大学時代にざっと勉強しましたが、スムーズに作業を行うために1日かけてブレインパッド様が公開しているSQL資料 を活用して再勉強しました。残りのBigQuery特有の操作などは公式ドキュメントなどを参考にクリアしていきました。

6月中旬は、初めて実ビジネスでのモデル構築を経験した思い出となる月でした。(学生時の長期インターン等でモデリング作業の経験はありましたが、その時とは異なる気持ちでした。)

予測モデルを構築すれば良いというわけではなく、ビジネスと言えば当然?な

  • 見積り書の作成など

の経費処理の経験も初めて行い、「これが社会人か」と社会人意識が芽生えたのもこの時期あたりからです。

11月 ~ 12月 開発業務とコンペ提案

この時期から開発業務にも関わり始めました。電通デジタルは電通と一緒に働くことが多々あります。
電通は広告の効果検証システムを所有しており、そのシステムに

  • 動画広告の配信量の推移を自動的に取得して整形、格納するデータワークフローをAirflowを用いて開発

を実施しました。
「Airflowとは何ぞや?」といった私のレベルでした。その為、最初はメンターにAirflowのチュートリアルを用意していただき、徐々に自分でチュートリアルを考え、Airflowの操作方法を習得しました。補足説明として、Airlfowとはコミュニティ(Airflow利用者)によって作られたプラットフォームのことで, 定期的に一連の処理を実行するようなワークフローをPythonで作成することができます。
私の所属グループでは、Airflow による開発を行う場合、Google Cloud PlatformのApache Airflowで構築されたフルマネージドのワークフローオーケストレーションサービスと呼ばれるCloud Composerを使用して開発を進めています。

開発業務では、

  • 自動化の構造の決定

  • デバッグ処理

  • Airflow環境でDAGを作成

などと個人的にはハードでした。しかし、作業前の自分と比べると、

  • 開発スキル

  • ニーズに応える力

などは大幅に身についたと今では感じています。

また、

  • お客様のウェブサイト分析

もGoogle Analyticsを用いて実施しました。この業務では、データ分析者にとっては必要だと感じている、

  • データによる事実とデータから得られる解釈を明確に分けて考えるスキル

  • 他人が分からないことを分かりやすく伝えるスキル

が少しは身についたと感じています。

開発業務やウェブサイト分析の他には、お客様と電通デジタルがパートナーになるために他代理店様と勝負する

  • コンペ提案への参加

も始めました。コンペ提案の参加によって、より一層自社理解やソリューション理解が向上しました。また、プロ意識も芽生え始めた時期です。

1月 ~ 3月 コンペ対応継続とインターン対応

1月からは引き続きコンペ提案への参加や、開発物の修繕、ウェブサイト分析などをこなしていました。特に思い出に残っている仕事は、

  • 2月に電通デジタルで24卒データサイエンスインターンを実施したときのメンター業務

です。インターンでは、疑似的なデジタル広告配信データを用いてデジタル広告の効果検証を、1週間でインターン生に実施していただきました。インターン生は6人参加していただいており、1人のインターン生に私はサポート役のメンターとして関わりました。メンターは6人いたのですが、皆さん私より先輩なので社会人経験不足な私としては少し不安な点はありました。しかし、インターン生と一緒に学ぶ姿勢で参加出来たことは良かったと思っています。

個人的な感想としては、「インターンは学生にとって成長する良い機会だ」と思っているので、インターン生に何か少しでも得ていただいていたら良いなと思っています。と同時に私も「データサイエンススキルやビジネススキル、その他多くのスキルをこれからも身につけないと」とモチベーションを上げさせていただきました笑


社会人1年目を終えて

社会人1年目が終了しましたが、結論電通デジタルに入社して良かったと感じています。これまでの内容で主に業務についてお話しました。

加えて、データサイエンスグループでは業務以外に外部勉強会(データサイエンティスト協会シンポジウム, AdTechTokyo etc..)にも業務時間内で参加し、自社以外の方ともコミュニケーションをとることが可能です。この経験は私が大学生時代で実施していたことと同じで、嬉しい限りです。

一方で、初めにお伝えした通り私は見習いデータサイエンティストである為、「これからも学び続けなければならない」と本記事を書きながら再認識しております。2年目からは私自身のポジショニングも考えながら、職務を全うしたいと考えております。

結び

ここまで記事を読んでいただきありがとうございました。
今回は電通デジタルで働く見習いデータサイエンティストの1事例をご紹介しました。データサイエンティストを目指している大学生や高校生は業務イメージだけでも掴んでいただけたら幸いです。

最後に宣伝となり恐縮ですが、電通デジタルでは新卒採用&中途採用でデータサイエンティストを募集しております。ご興味がございましたらご応募をお待ちしております。