見出し画像

データサイエンティストのPoCな日々

注意事項
この記事は完全にポエムであり、個人的な気持ちのみで記載しています。話半分で見てもらえると幸いです。

データサイエンティストって何してるのか

2021 年 5 月現在、データサイエンティストがもてはやされ始めてから幾ばくか経ち、人工知能や機械学習の現実的な落としどころが分かってきたころと思います。数年前は「人工知能がなんとかしてくれる」のようなマボロシがあったように思いますが、最近は企業でも AI を活用した現実の事例が増えてきています。

しかしながら、データサイエンティストを始めとする人工知能・機械学習に携わる人材は未だ不足していると言われており、身の回りにそのような業務をしている人がおらず、どんなことをする人なのかイメージがつかない方もいると思います。

そこで本記事では、人工知能・機械学習の分野に携わってきた筆者が、どんな業務をしているのかを簡単に共有したいと思います。

どんなタイプのデータサイエンティストの話か

機械学習を使うプロジェクトには、分類や予測といった「いわゆる機械学習」の技術の他にも、データを集める技術、データを処理する技術など、広範な技術が必要になります。さらには、機械学習がもつ不確実性と向き合いつつビジネス上の利益を着実に生むために、プロジェクトマネジメントやコンサルテーションのスキルも大切です。

筆者はその中で、プロジェクトの初期段階である PoC でのデータ分析とコンサルテーションをメインとする仕事をしています。PoC の始まり方は、事業会社の場合はビジネス部門から、機械学習案件を外販している SIer やコンサル会社の場合はクライアントの企業から引き合いから始まります。期間はだいたい 3 ヶ月程度です。

PoC をひたすら試行していく

ここで PoC(Proof of Concept;実証実験)について簡単に説明すると、「AI で〇〇したい」が、実際にできるのかを検証することです。例えば、「自社商品の販売履歴を分析して、商品の需要を予測したい」「社員の満足度アンケートを分析して、離職率を低減したい」「Web でのユーザの行動履歴を分析して、ターゲティング広告の効果を向上したい」などです。

ところで、PoC は「AI で〇〇したい」を検証することだと言いましたが、実際にできると結論付けられるプロジェクトはそう多くはありません。私の経験では、だいたい 10%、10 件に 1 件くらいあればいい方ではないかと思っています。PoC 貧乏(PoC ばっかりやってて売上が立たないこと)という言葉があるように、PoC は成功率がとても低いものなのです。(*1)

そのため、PoC の落とし穴を避けて少しでも成功率を上げることと、そもそも何度もチャレンジしていくことの両面が大切になります。私は基本的に PoC をひたすら試行する日々を過ごしています。

PoC の落とし穴をなるべく避けて進む

PoC には多くの落とし穴がありますが、その中でも私が思う大きめの落とし穴 2 つと、その避け方を紹介したいと思います。

ドメイン知識と業務フローを理解する

PoC が失敗してしまうことの大きな敗因の一つに、「よくよく考えてみたら、PoC の成果がビジネスに使えない(使いにくい)」ということが挙げられます。例えば、「とある商品の需要予測ができるようになったが、その商品の製造数は需要ベースではなくマーケティングによって決めるものだった」とかです。

この敗因は往々にして、顧客の業界におけるドメイン知識と、顧客の業務フローへの理解不足が原因のように思います。難しいのは、これらを深く理解するには顧客へのヒアリングが必要なのですが、顧客側はどの情報を提供すれば良いのか分からないことです。なので、ヒアリングの際は「商品の製造数を決める要因は何ですか?」のようなオープンな聞き方ではなく、「〇〇商品の製造数は需要ベースで決めていますか?それともマーケティングによって決まりますか?」のようなクローズな(仮説ベースな)聞き方をする必要があります。

私は特定の業界で働いたことがなく、ドメイン知識が欠けていることが多いです。なので、顧客のもとへ足繁く通って、自分の立てた仮説をベースにたくさん質問するようにしています。そうすることで、間違った(ビジネスに意味のない)方向へと進まないように気をつけています。

顧客の価値に結びつくゴールを設定する

PoC が成功したとしても、それが継続するとは限りません。成果(機械学習の恩恵)が労力(コスト)のわりに少ないと、ビジネス的にゴーサインが出なかったりします。そこで大切になるのが、PoC の先にある、価値ある未来を描くことです。

PoC では基本的に大きな成果は出ません。これは PoC の性質というか期間上仕方のないことで、かつそうあって良いものだと思っています。大切なのは、PoC の先には「在庫を XX%削減」「離職率 YY%低減」「売上 ZZ%向上」といったビジネスに価値のある青写真を PoC の前に定義して、その青写真に至るためのマイルストーンを設定し、PoC はそのファーストステップであることを説明することです。たとえ PoC の成果が小さくとも、達成したい課題があって、いま自分たちがいる立ち位置がはっきりしているのであれば、お客さんも納得してついてきてくれるはずです。(多分)

PoC を次に繋げるキーマンが夢から醒めてしまうと PoC は終わってしまうので、すかさず PoC の先に見えるものを提示して夢に戻しましょう。

PoC の先にあるもの

ここまでツラミばっかり書いてしまったので、機械学習とか PoC って大変なもののように感じてしまうかもしれません。しかし私はこの PoC を楽しく行ってます。理由としては、PoC に同じものはなく、毎回新しい課題や技術に触れ合えるので刺激的なことがあります。何より、できるか分からないものが、自分の頑張りによってできるかもしれないという可能性にチャレンジすることがとても面白いです。

人工知能というと、上振れした未来ばかりがもてはやされがちですが、地道に現実と向き合って少しずつでも社会に実装していければいいなあと思っています。

まとめ

夢はでっかくいこうぜ 

画像1

“You mustn’t be afraid to dream a little bigger darling.”「インセプション / Inception」(2010)

*1 ここでの成功率は、PoC の前段階(企画・構想)で終わってしまうものも含み、かつ成功は運用段階まで進めたものを想定しています。ですので、定義の仕方によって成功率も変わります。

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
データサイエンティストをしています。 Noteにはポエム的な記事を書きます。 技術的な記事はQiitaにて:https://qiita.com/koyaaarr/