見出し画像

私がデータサイエンスに期待すること

私は、修士時代に初めてデータサイエンスに触れてから今に至るまで、約5年間ずっとそれに関わることをしてきました。(詳しくは、以下の記事に書いています。)

その中で、広く浅い範囲は経験値を積むことが出来たと思うので、データサイエンスに対して何を思っているのか、今後何を期待しているのかを書いていきたいと思います。


将来に希望を見いだせる領域であってほしい

ビックデータが操作できるようになり、それに伴ってAI技術も著しく進化してきており、データサイエンスはブームの真っ最中であると思います。最近もChatGPTのようなゼロショット学習すらも実現したAIが出てきており、生物の特権であったかのような多様性が機械にも生まれつつあるのが今現在の状態です。

これに伴って、AIがクリエイティブなこともできるようになってきており、数年前にAIイラストがオークションで売れるといったこともありました。このように、AIから生み出されるコンテンツは私たちを楽しませてくれる、非常に高いポテンシャルを持っています。

一方で、AIはプログラムなので、使い方さえ覚えれば、熟練の技術を持っていなくても誰でも扱うことができます。それが原因で素晴らしい技術を持つ絵師さんがAIイラストによって割りを食っているのも現状です。このような現状に対処するために、AIイラストを禁止するなどの整備も進んでいるサービスもあります。

これは、新しいモノが生まれることによる浄化作用だと思いますが、AIに関してはものすごく早いと思います。私も、AIによって専門性が奪われてしまう時代がくるかもしれないと思うと常に冷や冷やしています。
興味の赴くままに発展していくのも面白いを思いますが、その結果、社会がどのように変わるかをみんなで考えていけるといいなと思います。

結局は使う人の資質だと思いますが、多くの人に好きになって貰える、役に立つ、豊かにするような領域であってほしいと思います。ただただお金稼ぎのための道具になってしまい、特定の人だけがその利益を享受できる状態になるのは悲しいです。私も少なくとも定年までは進化をワクワクしながら楽しめるように付き合っていければと思っています。

全ての人にとって意思決定に勇気をもたらす道具であってほしい

私たちは経験も頼りしてに日々様々な意思決定を行っていきますが、このときに強力な味方となり得るのがデータサイエンスの技術だと考えます。

データをうまく見える化することによって、私たちは過去の結果や成果を細かく理解したり、そこから未来どのようなことが起こるかを考えることができます。

または、数学の考え方によって私たちが思いつかなかった法則性・関連性を発見したり、私たちが考えた考察が尤もらしいかどうかを定量評価してくれたり、未来に起こることをそのまま予測したりしてくれます。

さらに、最近では私たちが意思決定を行わなかった(実際には起こらなかったので観測不可能な)選択による効果も見積もることができるようになってきました。

このように、データサイエンスは科学を基底にさまざまなことができるようになってきています。しかし、技術の発展によりデータサイエンスを扱うプロトコルが複雑に、データを扱うときの注意点も煩雑になっています。それが原因で世の中の人の大半は置いてけぼりになっていると思います。

理想をいえば、全ての人が平等に使えて、会話ができて、より良い議論となるような道具になればもっと良い世の中になると思いますが、現在のデータサイエンスの動きはそれから離れているように見えます。

実は、意思決定に必要なデータサイエンスの技術はもうすでに研究しつくされていると考えています。そしてそれは、比較的容易は原理で動かすことができる道具です。全てExcelで完結できるような範囲で、複雑なプログラミングを苦労して習得する必要はありません。

私は、もう既にデータサイエンスが誰にも簡単に扱えるような時代になっていることを強調したいです。そして、確かにそれは意思決定をする際に有用な根拠になることを知ってもらいたいです。さらに、今後の未来でもそのような道具であり続けてほしいです。

名前負けさせるような分野でなくなってほしい

私は、主にビジネスにおけるデータサイエンスの活用でデータドリブンでない判断を見てきました。

現象の理解のためにデータを見ているはずが、その結果は重視せずに直感を頼りにしてしまったり、データそのものを疑ってしまったり、予測をそのまま信じてしまって途中の過程や予測に対する解釈を見なかったり。一種のアレルギー反応のようなものを観測してきました。

事業を良い方向に転換させるためのデータ利活用であるはずなのに、逆にデータに振り回されてしまって悪い影響を与えてしまうのは悲しいです。

原因としては、データサイエンスはあくまで科学であること、科学の中でも実際に観測されないような机上の空論を扱う数学が中心であること、なので、とても抽象度が高く簡単に理解できるような分野ではないこと、一方で普通に利用する分にはそこまで難しい理論は必要ないこと、が認知されていないからだと思います。
実際、名前だけで難しそうだから敬遠する人もいると思います。

ビジネスでみる範囲のデータ利活用はそこまで複雑なことはやっていないはずで、よくよく考えれば十分に理解できるようになっていると思います。(統計学すら必要ないケースもあります。)そのためのプラットフォームも最近のものはかなり分かりやすく設計されていると思います。

私は、データサイエンスがもっと簡単なレベルで活用されてほしいし、誰でもできることを体験してほしいです。再度強調しますが、もうモノはあります。後は、世間的に蔓延しているイメージを払拭するだけです。

ということで、簡単でしたがデータサイエンスのこれから担ってほしいこと、変わってほしいことについて書いてみました。

最後までお読みいただきありがとうございました。

この記事が気に入ったらサポートをしてみませんか?