見出し画像

データ科学者がピペットを握る日は来るか

未知との遭遇

物事は見た目ほど簡単ではない。しかし自分とは全く無縁のものに触れる経験というのは、たまらなくエキサイティングだ。今日はナノポアシークエンサーと呼ばれる技術に実際に自らの手で触れて見た。

ナノポアシークエンサー

ヒトのゲノムも手のひらサイズのデバイスで測定できる技術がある。英オックスフォード・ナノポアテクノロジーズが開発・販売する、ナノポアシーケンサー。次世代の次世代シークエンサーと期待されているゲノムを始めとする分子を全部丸ごと読む機械だ。

ナノポアと自分

なぜナノポアを触ろうと思ったか。それはこのデバイスが将来の健康医療のあり方を塗り替えるポテンシャルを肌で感じたいと思ったから。ただ思わぬ壁というか良い経験ができた。

僕はデータ科学者だ。普段はデータを解析する方法論を開発している。またコラボでさまざまなデータに関わる課題解決を請け負う。

僕は一度も生物学を人から学んだこともなければ、もちろん実験などやったこともない。普段はコラボでデータ解析を専門に行なっている、いわゆるドライ屋さんと言われる専門だ。生命科学の知識は独学やコラボで勉強しただけ。

実習では生物学実験研究の経験者たちが10人前後、参加していた。その中で「僕、ピペットの使い方知らないんですよねー。これどやって使うんですか?」というのは、かなり勇気がいる。まるでパソコン使えない人がいきなりプログラミングを学ぶようなもんだろう。とにかくそれくらいのギャップがあった。

とりあえず、「僕はデータ科学者なんで、ウェット知識ゼロっす」とドーンと開き直って宣言してから実習に参加した。普段、僕がコンピュータを使えない実験屋さんにプログラミングを教えている立場が逆転したわけだ。

ドン引きされるかと思いきや、意外にもコミュニーケーションは活性化され、逆に後半のデータ解析の部分では、多少は力になれた。

ピペット触って思ったこと

失敗に対してタダでやり直しがきくか、あるいお金がかかってしまうのか、そこが決定的に思考回路に影響を与える。

僕がピペット操作を誤ってナノポアを一つダメにしてしまった時点でおよそ8万円が吹き飛ぶ。しかしデータ解析であれば、データがあることが変わらないので、何度でもやり直しがきく。

このプレッシャーは、データ科学にはない。

データ科学者にも、データ解析の緻密性や正確性は最低条件であるけれど、むしろ柔軟性な発想力や課題適応力が求められる。さらにソフトウェアがルーチンを半自動化するに従い、ミスしやすい部分もコンピュータがある程度は防いでくれる。

一方、実験科学者には、自動化できる部分は少ないし、柔軟な発想力に加えて、緻密性や正確性も同時に要求される。

料理に例えれば、データ科学者はレシピを色々と知って時と場合に応じてアレンジする力が必要であるのに対して、実験科学者は、レシピを忠実に再現する力が要求される。

データ科学者は実験科学者の両刀使いになれるか

これはなかなか難しいと思う。やはり、レシピのアレンジを得意とする人が、レシピを正確に再現する作業は耐え難い苦痛を伴うからだ。これは、全科目9割取れる人が、一つの科目で100点満点をとれるように訓練するのと同じくらいの苦痛感がそこにはあると思う。

実験科学者がデータ科学者の両刀使いになれるか

逆はどうか。これはいけるのではないかと思う。データ科学者には及ばなくても、ある程度のレシピのアレンジ方法は学ぶことができるからだ。しかもデータ解析は何度でも試行錯誤できるので、本人がやる分についてはノーコストである(当然、時間=コストという考え方をするとコストは「かなり」かかるけどね)。

データ科学者が実験科学を学ぶ意味はあるか

おそらくこれは必要ない。ただし一回くらい経験するのはいいと思う。データ科学者はデータ取得の苦労を知らないことが圧倒的に多いからだ。そこで意見の食い違いは往々にして起こる。

最低限、実験を見てフローを理解すればいいと思う。そこにどういう条件ノイズやバイアスがかかるのかを知るためだ。むしろ重要なのは、実験から得られる生命科学的な概念やロジックだと思う。

このデータが取得できると、そこからどういう生命現象を描き出せるのか、そこはデータ科学のレシピだけじゃなく、生命科学的な幅広い知識と精密なロジックが要求される。そこに力を注ぐ。

恥=汗をかくこと

何歳になっても恥をかくことを恐れたら、新しいことにはチャレンジできない。もし自分がクリエーターで恥を書く場面がしばらくご無沙汰であれば、危機感を持った方がいい。自分の思考回路は化石化している可能性が高いと思う。

運動しないと体が衰えるように、恥を書かないと創造性は失われると僕は思う。年齢を重ねると失敗は許されなくなるというのは幻想だ。むしろ失敗ウェルカムの環境をつくるために、自ら率先して失敗して恥をかく背中を後輩へ見せていくのがいいのではないかな。

自分もこう言う以上は、走り続ける覚悟を決めて実践しないといけない。

データ科学者=「超」アマチュア?

最後にアマチュアとプロの関係。これはキンコン西野×ホリエモンの「バカと付き合うな」からの受け売りだけども、創造性の高いものはプロではなくアマチュアから生み出されると思う。なぜかというと、新鮮さと勢いと、邪念がないからだ。プロは、その道のあらゆる失敗と経験を有している人だ。逆に言うと、失敗をしない分、チャレンジがない。思考実験の段階で止めてしまう。

データ科学者は、複数の科学分野を股にかける超アマチュアとしてチャレンジしていくことが求められているのではないかな。もちろんデータ解析の部分についてはプロであることが求められるけど。自分も含めて10年後、どういうデータ科学者が残っているかみて評価すればいいと思う。



この記事が気に入ったらサポートをしてみませんか?