見出し画像

データサイエンティスト組織における5つの基盤強化の取り組み

こんにちは。エムスリーにて、データ分析グループの担当役員をしている島田です。私たちデータサイエンティストは、各担当事業の成長にコミットし、ビジネス x データ x 分析技術のソリューション提供で、事業インパクトを生み出しています。そのメインタスクとは別に、継続的なパフォーマンスを発揮するため、各メンバーの業務時間の約10%を使って、グループの基盤強化に取り組んでいます。今回は、その中から5つの取り組みを紹介します。


1. 採用

エムスリーでは、採用活動を非常に重要視しています。人事グループと共に現場のデータサイエンティストが主体となって、面接やインターンシップの運営を行っています。
中途採用・新卒採用活動では特に2つのことを意識しています。1つ目は、候補者の方に業務内容・働き方を含めて、入社後の状態をできるだけ正確にイメージしてもらうことです。2つ目は、採用する側として、スキルだけでなくカルチャーを含めて、候補者の方とデータ分析グループとの相性を見極めることです。せっかく入社いただいたのに短期間で離職されるのは、候補者の方・エムスリーの双方にとって大きな損失です。誇張・卑下することなく、ありのままを双方で議論できるよう努めています。
そのため、入社後に携わるであろう業務を体験いただけるような面接・インターンプログラムになるよう担当者が創意工夫を重ねています。候補者の方には是非楽しんで、選考プロセスに臨んでいただきたいです。

2. 人財開発

所属するデータサイエンティストのパフォーマンス向上への取り組みが人財開発です。エムスリーのデータサイエンティストの典型タスクを定義し、研修メニュー化することで、入社したばかりの方でも早期にキャッチアップできる仕組み作りをしています。
その他、勉強会(データ分析グループ勉強会について)やデータ分析コンペ(Kaggle NFL ソロシルバー獲得記)も本取り組みの一環として取り組んでいます。
今後は、データサイエンティストに必要なスキルを定義する予定です。各メンバーがどのようなスキルを身に着けるべきか、より高いパフォーマンスを発揮するためにどういうアクションを取るべきかのガイドラインを設定します。

3. 情報発信

社外情報発信、社内情報発信、ナレッジマネジメントの3つの役割があり、私たちのケイパビリティを認知してもらうために取り組んでいます。
社外情報発信は、採用活動や製薬企業様向けの情報発信です。採用サイト本noteだけではなく、医薬業界向けの情報誌ミクスへの連載(製薬マーケティングにおけるデータ活用)も行ってきました。
社内情報発信では、社内のコンサルタントやプロダクトマネージャー向けの事例共有会や効果検証等の統計に関する勉強会を定期開催しています。データサイエンティストが伴走して、ビジネスメンバーがデータ分析プロジェクトを完遂させるD-1グランプリでは、非分析者の統計スキル向上にも貢献しています。
ナレッジマネジメントは、データ活用の過去プロジェクトを一括でまとめる活動です。カタログ化を通してプロダクトのラインナップを整備し、事業側への社内営業を行っています。過去プロジェクトのマッピングから成功パターンを見える化し、どこにポテンシャルがあるかを一覧化するのにも役立っています。

4. 質担保

アウトプットの精度を向上させる取り組みで、内容は多岐にわたります。
たとえば、コードレベルの品質を保つために、開発における基本ルールの策定やコードレビューの標準化を行ってきました。以前は、各データサイエンティストが独自のやり方で開発していましたが、この活動のおかげでコードの保守性が大きく向上しました。
精度検証レポートも重要です。ソフトウェアテストよりも、機械学習システムテストは難しいと一般的に言われています。開発当初は適切に稼働していても、いつの間にか精度が悪化することも起こりえます。それらを回避するために定期的な精度検証レポートの提出とビジネス側への送付を義務付けています。精度レベルの確認と共に、周囲のビジネスメンバーに各種ツールに対する安心感をもってもらい、利用を促進しています。
一つ一つは、軽視されがちな内容が含まれますが、品質レベルをキープするためのこのような積み重ねが、周囲からの信頼獲得に大きく寄与しています。

5. 基盤整備

データ分析グループの開発環境向上を目的とした活動です。
増加する実行バッチに対応するため、データ分析グループでは最近AWSの活用を始めました。導入当初は、クラウド環境に詳しくないデータサイエンティストも多数在籍する中で、データ分析におけるベストプラクティスがわからない状態にありました。基盤整備担当のメンバーが、調査をしたうえで標準的なAWS環境の用意と、データ分析グループにおける推奨利用方法を定めて、AWSの活用を促進しています。
コーディングにおける開発環境整備も行っています。定期的にバージョンアップがされるpythonに対してどのバージョンを利用すべきかの指針を示しています。さらに、Anaconda有償化に伴うminiforgeへの移行も基盤整備担当者が積極的にリードして、標準化を進めています。

さいごに

いかがでしたでしょうか。これらのテーマは所与のものではなく、データ分析グループメンバーがグループ全体のパフォーマンスを向上させるために必要なことを議論して出てきた結果です。定期的に見直しが行われ、今後もかわっていくものです。
エムスリーのデータ分析グループでは一緒に働く仲間を絶賛募集中です。興味を持っていただけた方は、採用サイト中途採用求人票新卒採用求人票をご確認のうえ、ご応募をお願いします。