大学院生が"あえて"就職前に医療LLMスタートアップで"働く"理由

2024年10月5日 21:08

みなさん、はじめまして。
医療AIのCubecでデータサイエンティストとして働く塚川です。

私は現在、神戸大学大学院システム情報学研究科で研究をしながら、医療AIのスタートアップ、Cubecでデータサイエンティストをしています。大学院ではMR画像を用いた研究をしていることもあり、医療系スタートアップで働いてみたくてCubecに参加しています。

ChatGPTには個人的にも注目していました。ですが、まだまだ改善の余地が大きいこと、その改善の先に大きな可能性があることは、Cubecで働いたことで解像度が上がりました。また、将来的に起業を視野にいれている私にとっては、学生のうちにスタートアップに参加し、経営者の近くで働けることも有意義な経験です。

では、Cubecでの仕事について、具体的に紹介していきたいと思います。

診療Q&Aを開発中のデータサイエンスチーム

Cubecが開発する「次世代治療提案型AI」は、診断から治療立案まで支援します。初期ターゲットとして、慢性疾患の中でも日本で患者数が急増し、社会的に緊急性の高い「心不全」を対象に開発を進めています。

プロジェクト全体は、国立循環器病研究センターをリーダーとして、琉球大学、帝京大学、名古屋大学医学部附属病院、九州大学病院と共同で進めていますが、Cubec共同創業者でCAIOの新井田さんを中心とする社内のデータサイエンスチームでも「診療Q&A」を自社開発をしています。

「診療Q&A」は、かかりつけ医が意思決定するための関連情報を、認められたエビデンスから提供するLLM（大規模言語モデル）です。膨大な量の循環器領域のエビデンスをインプットさせ、エキスパートと同じレベルのアウトプットするLLMなのですが、この初期バージョンは2024年夏に完成し、現在はこれの改良を続けています。

何を担当しているのか

データサイエンスチームで、私は次の３つを担当しています。

1 　Hugging Face
2 　表RAG
3 　検証

1 　Hugging Face
Hugging Faceは、アメリカのHugging Face社が提供するAI開発のオープンソースプラットフォームです。情報共有のコミュニティで、ユーザが開発したAIをアップロードすることも可能です。私は市場に出たばかりの医療系のモデルを実際に動かしてみたり、それが日本語に対してどの程度の性能が出るかを確認しています。

2 　表RAG
RAG（RAG：Retrieval-Augmented Generation）は、既存のLLMに外部知識を組み合わせる技術です。医療の場合、論文やガイドラインには本文だけでなく表形式の情報が含まれます。私はこの表の情報をLLMにどう組み合わせるかを調査していたのですが、マークダウン方式で記述することで表を認識できることがわかりました。RAGで表を取り込んで出力することを試している企業は、まだ少ないのではないかと思います。

参考：RAGについては、下記noteでもわかりやすく触れています。

3 　検証
表RAGの仕組みを、実際にCubecが開発しているモデルに搭載して検証してみています。ここは、まだこれから進める部分です。

Cubecにジョインした理由

もともと、ミラーレスカメラで写真を撮ることが好きだったこともあり、情報処理の中でも画像処理に興味関心がありました。大学院の研究室の中で、たまたまMR画像を用いた研究があり選びました。ですが、大学自体は医療関係ではなく、私自身が医療に詳しいわけではありません。

お医者さん、患者さんに関わる研究を進める中で、学問領域に閉じず、社会実装するCubecのシステムを知ることが、研究にも活きるのではと考えました。

また、将来的には起業を視野に入れていることも、スタートアップのCubecを選んだ理由の一つです。起業といっても今すぐにではなく、来年春には大手のITベンダーへの就職が決まっています。大企業の仕組み、ビジネスモデルを経験した上で、その先に起業の道を考えていきたいと思っています。

来春には社会人としてのキャリアが始まる前、残された大学院生活のうちに、これまで学んだことを実際に活かせる挑戦をしてみたかったのです。以前は塾のバイトをしていたので、研究に役に立つ情報処理の最前線を、Cubecで働きながら経験できるのは大きなメリットです。

生成AIとLLMの世界に踏み込んでみて

大学で情報系の勉強をしているので、機械学習の基本的な構造は理解していました。しかし、生成AIについてはChatGPTを触って「すごい！本当に流暢な日本語がアウトプットされる！」と驚いているレベルでした。

Cubecのプロジェクトに関わることで解像度が上がり、ChatGPTの凄さを改めて認識しました。ですが、ChatGPTがまだまだ万能ではなく、改善の余地がとても大きく、その改善の先に新しい利用価値があることがわかりました。その一つが、Cubecで開発している医療特化のLLMです。

生成AIとLLMの経験が少ない私でしたが、Cubecのメンバーのサポートもあり、とても実りある時間が過ごせています。

大学院の研究とどう両立しているか

Cubecでは月に働ける時間を相談した上で、いつ、どんな風に働くかは個人の裁量に任されています。私の場合は、研究に集中する日と、Cubecのタスクを進める日を分けています。

Cubecでの仕事は、新井田さんと相談して目標をセットしています。私にとっては少し高めの目標だと思って設定したゴールでも、目的は何か、新井田さんに問われてハッとすることがあります。大学院の研究では、大きな目標はありつつも、そのプロセスの途中では脇道に外れたりしながら進むことがあります。
Cubecでの時間は、目的に向かう筋道の確からしさと、結果を受け取る先の人のことまで考えたアウトプットかどうかなど、新井田さんからフィードバックをもらって軌道修正しています。

基本はリモートでの仕事ですが、神戸を拠点にしている代表奥井さんとは、神戸のシェアオフィスで対面の打ち合わせをすることもあります。

奥井さんは、社会課題とビジネス構造、ビジョンの言語化がすごくて、考えていること伝える技術がいかに大切か、勉強させてもらっています。

自分が開発に携わったからこそ実感したことですが、医療特化のLLMを開発するというのは、まだ誰も踏み入れたことがない領域です。参考にできる論文やスタートアップもまだまだ少ない中、ゼロイチで事業を作るのは並大抵のことではありません。だからこそ、奥井さんのビジョンをぶらさず、組織カルチャーを大切しながら事業を伸ばす姿勢に刺激を受けています。

経営者の姿勢を間近に感じて仕事する経験は、いつか自分が起業する時にきっと役に立つことであり、大学院では学べないことです。学生のうちにスタートアップで仕事ができるのは、私にとっては貴重な経験です。

Cubecのいいところは、大学や大学院の忙しさも踏まえた働き方を相談できること。興味ある人はぜひ、カジュアル面談も申し込んでみてください。

Cubecメンバー紹介一覧
vol.1 【データサイエンスチーム中村】
臨床医を目指す医大生が、医療AIのCubecでデータサイエンティストとして働く理由
 vol.2 【データサイエンスチーム新井田】
データサイエンティストのマインドチェンジ〜ディープラーニング時代から生成AI時代へ〜
vol.3【プロダクトマネージャー酒井】
臨床工学技士から医療AIのプロダクトマネージャーへ〜医療の現状をテクノロジーで改善したい〜

この記事が気に入ったらサポートをしてみませんか？