見出し画像

10Xで一人目のデータサイエンティストの奮闘記

この記事は10X創業6周年アドベントカレンダーの19日目の記事になります。
昨日はCorporate Operations部のまなさんが、「10Xで過ごして変化してきた「D&I」の捉え方」という記事を公開しています!

(写真はたしか群馬県のどこかにある古墳に行ったときのもの)

はじめに

前回の記事でも書いているのですが、去年の10月に職種変更となって以降、10Xで一人目のデータサイエンティストとして働いています。この記事には次のような文章を書いているのですが、リベンジができないまま今年も半年が過ぎてしまいました。

今回の職種変更を機会に企業のデータサイエンティストは何を担うべきなのかを考えないといけないなと思っていました。実はこの10月のタイミングで上記の記事に関連したブログを書こうと下書きまで書いていたのですが、考えがまとまらないまま年末を迎えてしまいました。。。(来年リベンジしたい)

2022年の振り返り

この問いに対する答えは出ないまま、半年間データサイエンティストとして活動をしてきたのですが、本記事では半年でどのようなことをやってきたかを部分的に振り返ります。

よくある「データが整っていない問題」

当初想定していたデータサイエンティストの業務内容は以下の通りです。

- データ分析を用いた仮説の立案、および課題の特定
- データ分析や統計モデリングを用いたステークホルダーの意思決定の支援
- 施策や新機能の効果検証のため実験(A/Bテスト)の設計
- Stailerで提供される推薦や検索、需要予測などの機械学習モデルの開発

Data Scientist 業務概要(非公開)

この中で特に重要となるのが、統計的モデリングや機械学習などの技術を利用した意思決定支援や価値提供と、効果検証のための実験です。

前述のような仕事をやるぞと意気込んでスタートしたわけなのですが、実際には、データサイエンスを活用できるという場面は本当に限られたところにしかありませんでした。その限られた仕事についてはSWE(ML)の千葉さんのブログに詳しく書いてあるのでここでは割愛させていただきます。

なぜ限られた場面しかなかったのかといえば、データサイエンスを活用するためのデータが不足していたり、機能開発の優先順位の調整が難しかったり、効果検証をしようにも条件が難しかったりというような企業でよくあるデータが整っていない問題に直面したからです。

今あるデータの価値を最大化する

プロダクトのデータを活用できる準備をする

まだ発展途上であるプロダクトでもそれらのデータが活用の観点だと足りない情報があることは一般的によくあることだと思います。そのようなデータ(特にイベントログ)について、「どのようなパラメータを取ればいいのか」「発火しているタイミングは適切なタイミングなのか」「欠損などのデータが正常に送れないケースはありえるのか」のような点をデータサイエンスの視点でレビューをする取り組みを進めています。また、日常的に分析を行うアナリストなどからデータについての疑問や問題点を集約して開発に届けるための定期的な情報収集も行い、開発にフィードバックできるようにしています。

効果検証の重要性を啓蒙する

まだユーザーが少ないプロダクトでは効果検証が難しいことが多いのでどうしても実際に効果検証を進められないケースが多いと思います。しかし、効果検証は施策を実施する前に計画することが好ましく、施策の実行者に効果検証の考え方を理解してもらうことは非常に重要です。そこで、実際にA/Bテストをするときにどのような観点を気をつけるのかというのを理解してもらえるように社内で勉強会を開いたり、実験計画書のテンプレートを用意して実験をしたいときに書いてもらう取り組みなども進めています。(画像は途中で切れています)

実験計画書のテンプレート

データサイエンスの概念実証(PoC)

こうした取り組みを進めていく一方で事業開発が進み、事業機会が増えてきたことによって最近はデータサイエンスを活用できそうな事例が増えてきました。まだ始まったばかりなので技術的な内容はありませんが、ここでは具体的な事例をいくつか紹介します。

求めている商品を素早く探すための推薦

一般的なECとは異なり、一度に数十点ほどの商品を購入するスーパーの購買体験では推薦のような技術は重要になります。このような性質は一般的に広く利用される推薦技術とは異なるので、プロダクトのUXを含めてどのような商品を提示するかのアルゴリズムを検証していく必要があります。現在はこのようなアルゴリズムをいくつか開発するのと、これらのアルゴリズムを意思決定者がすぐ体験できるようなデモ環境の開発に注力しています。

販促施策のためのユーザークラスタリング

ユーザーがネットスーパーを利用する理由は様々です。例えば、感染症が流行している時は自宅待機をする必要があり、その時に一度だけネットスーパーを利用したという方も多いのではないでしょうか。また、家庭によってはもう実店舗にはほとんど行かなくなって、ネットスーパーを週に数回使っているという方もいると思います。このようなユーザーによる違いを理解することで販促施策に大きく役立てることができると考えています。

おわりに

まだデータサイエンティストとしてはデータサイエンス以外の部分を進めないとできないタイミングですが、将来の組織のあるべき姿から逆算してデータを蓄積していったり、データサイエンスの啓蒙活動を進めることで事業機会が増えたときに最速で概念実証(PoC)ができるように準備しています!

また、10Xのデータに関する仕事に興味が出てきたという方は以下の記事を読んでみることをおすすめします!

最後に10Xではメンバーを募集しています!採用ページもぜひご覧ください。明日はRetail Strategy & Operations部の栃内さんが記事を公開する予定です。お楽しみに!

この記事が気に入ったらサポートをしてみませんか?