見出し画像

【社内イベント】データマネジメント・データエンジニアリング勉強会を開催しました

株式会社サイキンソー プロダクトマネージャーの桐山です。
先日社内でデータマネジメント・データエンジニアリング勉強会を開催しました。サイキンソーは個人向けの腸内フローラ検査「Mykinso(マイキンソー)」を提供しています。ECと医療機関経由で販売しており、それだけ取得可能なデータやトラッキングも膨大にあります。また、検査を受けていただいた方の腸内フローラのデータ(どんな菌が多いか、など)と生活習慣に関するアンケート内容を突き合わせ、腸内フローラの状態を示すスコアリングや疾病リスク判定などのアルゴリズムも開発しています。統計解析やAI解析に長けたメンバーも多く、もっとデータを利活用できないかという声も多いです。

データが豊富にあり社員の関心も高い弊社ですが、データの活用の仕方について、すべてのメンバーが理解しているとはいえませんでした。加えて、社内にはどんなデータ活用のニーズや課題があり、どんなデータが存在するのかといった疑問がチームや部署を超えて共有されている状況ではありませんでした。そこで、まずは「データ基盤の全体像」を理解してもらい、社内のデータ利活用を活性化したいと思い勉強会を企画しました。

勉強会の概要

勉強会は2回に分けて開催しました。
第1回のゴールは、「データ基盤の全体像」を理解して、今後の社内での共通言語にすること。指定本「実践的データ基盤への処方箋」を輪読し、データ基盤の全体像を理解してもらうとともに、日々のビジネスでおかれている課題について考えてもらうきっかけづくりと位置付けました。

第2回のゴールは、チームや個人のビジネス上の課題を共有することで、今後のデータ利活用のヒントにすること。参加者にユースケースのアイデアを出してもらい、それを既存のデータでどのように解決できそうか議論するワークショップを開催しました。

日々データを扱うDataOps TeamやWeb Teamをはじめ、営業・総務・広報・ロジスティクスなど、様々な部署のメンバーが出席いたしました。

指定本「実践的データ基盤への処方箋」の紹介

勉強会の題材とした書籍は 技術評論社『実践的データ基盤への処方箋〜 ビジネス価値創出のためのデータ・システム・ヒトのノウハウ』です。

著者は「ゆずたそ」さん、「渡部 徹太郎」さん、「伊藤 徹郎」さんの3名です。

ゆずたそさんは、ITコンサルタントとして多くの会社のデータ基盤の構築経験があり、datatech-jpというデータエンジニアリング・データ活用のコミュニティ運営もされています。
渡部さんは、大学時代にはコンピューターサイエンスやデータベースを研究し、その後はデータエンジニアとして様々なデータ基盤をゼロから構築・運用した経験が豊富な方です。
伊藤さんは、10年以上データサイエンス業界におり、データ分析受託企業でのコンサルティング経験や事業会社におけるデータ分析など幅広い経験があります。

書籍の選定理由として以下が挙げられます。

  • データ基盤の全体像が分かりやすくコンパクトにまとまっていたので、非エンジニアでも内容が理解できそうだった

  • 第2章ではデータ基盤の技術的な話、第3章ではデータマネージメントの話など、より詳しいテーマに興味をもったメンバーと追加で勉強会を実施できそうだった

第1回のサマリー

第一回は指定本の解説を中心に行い、非エンジニアのメンバーにも下記のような内容をレクチャーしました。

  • データ基盤の一連の流れについて(例:データソース、データレイク、データウェアハウス等の用語の解説)

  • データの入り口と出口をマッピングするCRUD法について

  • ERD図の読み方と書き方について

  • ユースケースの定め方について

次にFigjamでシェアリングを行いました。参加したメンバーからの声を一部抜粋して紹介いたします。

非エンジニアからは会計、広報、ロジチームのコメントを抜粋しました。
どのポジションも日々の業務でデータを活用する機会が多く、業務効率化や情報発信の観点でデータ基盤に関心を持つきっかけになったようでした。

会計、広報、ロジのコメント

エンジニアからはWeb TeamとDataOps Teamのコメントを抜粋しました。
開発者視点でデータソースを綺麗な水源にしていきたいという意気込みや、データレイク/データウェアハウスにAWSのサービス等をうまく活用して実装してみたいといった感想をいただきました。

エンジニアからのコメント

第2回のサマリー

第2回は以下のお題をもとに実際に知りたいデータのアイデアを出しながら、どんなユースケースに繋がりそうかをディスカッションいたしました。

知りたいデータのアイデアは、以下のようなものがあがりました。

  • 商品サイトやコンテンツの流入情報、閲覧率、ヒートマップなどのトラッキング

  • サービス満足度などのアンケート

  • 出荷した日時と個数

  • 時期ごとの検査結果と傾向

  • かかっている病気や服薬しているお薬などのユーザー情報

ユースケースとしては、コンテンツ制作やWEB広告出稿といったマーケティングに関するものが多く、ロジ関連では月ごとの出荷数のグラフ化、広報からは、年ごとの腸内フローラの特徴をプレスリリースにしたいといったアイデアが出ました。
また、病気や服薬している薬ごとの菌叢変化を知りたいという、研究観点からのアイデアもありました。

勉強会をしてみて

最初に勉強会を企画したときは、チームリーダーやデータに関心のあるエンジニアの数名が参加するくらいかなと思っていたのですが、勉強会を告知すると、会社のいろんな部署に所属するメンバーが参加してくれました。社内のデータ利活用やデータ基盤への関心の高さが可視化されたのがとても良かったです。

会社の事業成長とともに、会社の部署やメンバーが増えて、データの量や複雑性が増えてきました。このような背景もあり、データの利活用やデータソースに関する課題を社内で見かけるシーンが多くなりました。そのため、今後は、データ基盤の上流と下流の課題や要望をうまいことデータ整備に落とし込むプロセスがより重要になってきます。そのときには、書籍で説明された「データ基盤の全体像」がメンバー間で共有されていると、社内でのコミュニケーションが円滑になると思います。

また、書籍では「ユースケースに思考の9割を使うべき」という一説があり、多くの参加者の印象に残ったようです。自分たちの2回目の勉強会では、データソースやユースケースを書き出してみたのですが、ユースケースを書くのが難しかったという声が参加者からありました。なので、データ活用側で、ユースケース作成や仮説構築の能力をより研ぎ澄ます必要があるなと実感しました。

社内全体でデータ利活用を促進するためには、データを扱いやすくする技術的な基盤の整備だけなく、データ活用側のリテラシー向上や組織においてデータ活用の価値を高めるなど、多くのファクターが重要になります。今回の勉強会で、「データ基盤の全体像」が緩やかに共通言語になったと思います。継続的に勉強会やディスカッションを行い、サイキンソーをデータに強い組織にしていきたいと思います!

最後に

サイキンソーでは「細菌叢で人々を健康に」というミッションを共に実現する仲間を募集しています。

また、以下のフォームからカジュアル面談をお申し込みいただくことが可能ですので、お気軽にお申し込みください。

その他、Twitter(@YoheiKiriyama) でも相談を受け付けているのでお気軽に DM などでご連絡ください。

この記事が参加している募集

オープン社内報