見出し画像

PREVENT データサイエンス部_2022年振り返り

年末といえば振り返り。ということで、PREVENT_データサイエンス部(DS部)でも振り返りブログを書きたいと思います!
執筆担当はトッティこと戸田です。よろしくお願いします。

DS部(当時はチーム)は2018年に発足しました。早いもので、4年が経ちました。これまで振り返りたいなと思いながらも・・・書けずにいました。今年になってDSブログを立ち上げたので、これからは年末の恒例行事にしたいなと考えています。

詳細については言えないところも多々ありますが、出来るだけ具体的にお伝えできればと思っています。DS部が何を目指して、何を達成できたかをまとめていきます。

PREVENTの事業進捗については、ホームページのニュースをご覧ください。


はじめに

弊社の場合は、事業年度を7月から開始としています。そのため、年末の振り返りは前事業年度3Q ~ 現事業年度2Qという感じの区切りになります。

1~6月の上半期は、

『個別化Disease Management Program(DMP)の準備、はじめます。』

という目標に対しての到達状況。

7~12月の下半期は、

『データインフォームドな意思決定の促進』
『分析の民主化運動』

という目標に対しての進捗状況。

それでは、張り切って振り返っていきたいと思います!

上半期の振り返り

今年の上半期(事業年度2022年3~4Q)を振り返ります!

事業年度2022年1~4Qの大目標

事業年度2022年1Qの全社会議で宣言したことは、

『個別化Disease Management Program(DMP)の準備、はじめます。』
1. データに基づくPrecision DMP
2. DMP価値の可視化

ということでした。全部門が集まる会議ということもあり、キャッチーな言葉使いにしています。

PREVENTのコア事業である重症化予防事業Mystarはユーザー様一人一人に合わせた個人指導を実施しています。弊社の医療専門職による指導は、論理的なアセスメントと臨床推論や行動変容理論などの手法を用いて相当に高品質な指導をしています。なので、個別化DMPをしていないというわけではありません。

DS部としては

  • 類似ユーザーや過去プログラム結果などの情報へのアクセス。

  • プログラム後の追従などの長期的な結果の可視化。

を推進し、鬼に金棒を渡してしまいたいという感じで目標設定をしました。

分析基盤の構築

上記を達成するために、分析基盤を構築する必要があり言わずと知れたよろずやが誕生しました。拡張性の高いETL基盤選択によって実現されており、非常に迅速な対応が可能となりました。

組織づくり的な動きとしては、分析基盤構築をゴリゴリと進めていただくためデータエンジニアというポジションを新設しました。その際にチーム編成を見直し、データサイエンティスト、データエンジニア、データアナリストのポジションとジョブスクリプションを整備しました。

この分析基盤構築がDS部としての今年1番の成果だったのではないかと思っています。

加えて、よろずやという言葉の社内浸透とともにデータコレクションやリサーチクエッションを円滑に実施する仕組みを整備しました。

恒常的タスクの効率化

大目標には書かれていませんが、DS部として取り組まなくてはならないこともありました。それは、Myscopeや社内KPI管理などの一度完成すれば保守・運用フェーズになるようなタスクを効率化することです。

  • 高頻度で出力が必要な解析結果の効率化・自動化。

  • 常時確認が必要な指標のダッシュボード化。

このような恒常的タスクをいかに正確に素早く処理するかという課題に対してチャレンジしました。ここは実業務と密接に関係しているので詳細は省きますが、マスターデータ管理を効率化するフローができたことは大きな成果でした。

社内データ活用支援

その他にも、企画部案件の個別解析や共同研究などをサポートしました。分析基盤の構築段階であったものの、DS部メンバーの個人技に頼りながら複数の成果を出すことができました。アカデミックな成果企画部事業成果でもしっかりと形になっています。

DBから中間ファイルを作成し、分析用のデータセットをヒィヒィ言いながら作っていたおかげで、使用用途がある程度決まった状態で分析基盤を構築することができました。

また、社内的にもいくつかのチャレンジを実施できました。
DMPのプロセスを客観的に理解しようとする試みや新規の予測モデル構築など深く解析する案件も増えてきました。

その他

◆ 輪読会
DS部内で実施している輪読会です。以下の本に取り組みました。

◆ インサイト共有会
インサイト共有会という部内情報交換会を始めました。
DSチームからDS部となりましたが、まだまだリソースが限られていますので分散型の体制をとっています。各人がアサインされたプロジェクト内での解析を共有する機会を作らないとどんどん属人化していきます。
そこで、slack上で各メンバーが出しているグラフや解析結果に対して興味を持ったメンバーがスタンプを押すとインサイト共有会のお題としてストックされるという仕組みをつくり、隔週でそのお題の当事者が解析方法や結果の見方などを共有する会を立ち上げました。

下半期の振り返り

残り下半期の振り返りです!一年振り返ると長くなりますね。

事業年度2023年1~4Qの大目標

全社会議で宣言したのは、ずばり

  • データインフォームドな意思決定の促進

  • 分析の民主化運動

です。並べて書くと前回の目標の方がすごそうな感じですが、解像度がグッと増したという感じです。

言い換えると、社内外のPDCA支援とDataOpsの運用です。これまでの4年間ずっとこれらを実現するために動いてきたと言っても過言ではなく、コツコツとパーツ作りを実施してきました。メンバーも揃い、いよいよ本格的に着手できるフェーズになりました。

分析基盤の拡張

よろずやにどんどんデータを集めています。これまではMystarプログラムデータのみでしたが、営業部で入力されたデータやCRMデータなど経営に関わるデータも統合されました。これまで以上に、経営の意思決定に貢献できることが期待されます。

加えて、匿名化処理したデータのアクセシビリティを高めるためにPrevent Medical Data Base(PMDB)を構築しました。

BIツールへの移行

データドリブンではなくデータインフォームドな意思決定を推進するには、ドメイン知識を持ったプレーヤーの情報へのアクセシビリティ向上が必須となります。

それに加えて、DS部外のプレーヤーが手軽にデータを扱えるようにすることも重要です。具体的には、TableauやSupersetを用いてドリルダウンしながらの複数軸に対しての議論やKPI以外の関連指標の確認や結びつけなどなど。
外部ツールの導入が完了したので、色々試しながら最適な形を探索できる状態にまで持ってくることができました。

DataOpsの運用

いわゆるDataOpsの運用にチャレンジしています。

DS部以外のメンバーに対してSQL勉強会やダッシュボード作成にチャレンジしてもらう機会を提供するようにしました。

データ品質やデータライフサイクルを意識した運用などまだ作り込む必要があるものの大枠の形が見えるところまで辿り着くことができました。

その他

◆ 輪読会
DS部内で実施している輪読会です。以下の本に取り組みました。

◆ データアナリスト教育体制
実務経験ありでヘルスケア分野に興味があるデータサイエンティストやアナリストを採用するのは難しいです。そのため、社内転籍を受け入れました。オンボーディングやOJTを整備しました。
転籍アナリスト(医療部門からDS部)のブログもありますので、興味のある方は読んでみてください。

DSとしての業務経験が豊富なメンバーが揃っているわけではないので、転籍や未経験者を受け入れることはお互いに成長できる機会だと考えています。

◆ 解析ティップスの共有
内容は名前のように可愛いものではなく、githubを使って分析コードを管理する体制を作りました。

これまでプロジェクトごとでアサインされたメンバーがどのような解析をしているのかが共有されてきませんでした。
レビューは実施していたのですが、当事者間でしか知見の共有はできていませんでした。DS部としての知見になっていないことを非常に問題でした。
インサイト共有会はこの問題に対しての一つの取り組みでしたが、さらにメンバーからgithubを使ってコードも共有し蓄積していこうという声があがり、コード管理も運用を開始することができました。

まとめ

業務をやっていると課題ばかりが目について自分達は進んでいるのか?何か成し遂げられたのか?という不安にかられることがあります。
振り返り記事を書くことで、そんな不安も払拭でき、よくやっているじゃないかと自分を労うこともできました。

DS部のメンバーにも読んでいただき。ここまで進捗できていることを改めて認識してほしいという思いです。
今年も、本当にいろいろとやりました。我々は確実に進んでいます!この調子でヘルスケア分野のデータ活用を盛り上げて、ジャンジャン価値を出していきましょう!

来年の抱負を書く体力はなくなりましたので、また違う記事で紹介したいと思います。

それでは、また!