見出し画像

翻訳としてのデータ分析#36 データ分析という仕事は細かな意思決定の連続

原文抜粋 : ダジャレをどう訳すか

笑いの再現も大事だけれども、文脈を壊さないことのほうが大事と判断するわけです。

『ぼくは翻訳についてこう考えています -柴田元幸の意見100-』より

データ分析に置き換えて考える

データ分析という仕事は、細かな意思決定の連続である。
いや、まあ、あまねく仕事がそうだと思うけれど。

だけども、どうもイメージとしては「データ→数的処理→算数→答えが一意に定まる」のように思われる向きが強いと思う。実際、理系の人が多いし、プログラミングする部分もあったりするので、何となくそう思われやすい。

「科学する」とか「サイエンス」という言葉も併用されやすい。そうしたワードも何となく「正解を教えてくれるんでしょ?」という気持ちを誘発しやすい。

だが、そんなことはない。
1ミリもない。

同じ現実的な「〜を知りたい」という要求があった場合に、どうデータを分析するか、は人によって異なる。分析屋が10人いたら、10人とも異なるアウトプットを出すだろう。

特に、要求の抽象度が高いほど振れ幅は大きい。

Kaggleの予測系コンペのように、目的と使えるデータが決まっていたら、似通ったアプローチが生まれやすい。けど、実際のビジネス場面は、課題の捉え方とアプローチに、無限の組みあわせがある。

だからもちろん、予め決まった正解なんてなくて、正解にしていくしか方法はない。

そういう意味で、細かい意思決定の連続なのだ。

課題をどう定式化するか?
どのデータを使うか?
データをどうハンドリングするか?
どの分析方法を用いるか?

経験を積むと自分の中で「こうしておけば大体間違いない」というパターンが蓄積されて、ある程度は勝手に判定できる。が、基本的には、意思決定し続ける必要がある。その時、何を大事と判断するのか?

僕は「現場で使い続けられること」を最も重んじたいと思っている。

続けられる、というのがミソで。
続けられるためには、再現性をある程度担保できないといけないし、運用に耐えられる仕組みでないといけない。

ただ、それさえ達成できるならば、あとは何でもいいと思っている。
何でも正解にしていける。

必然、判断材料は、使い手や関係者とのコミュニケーションで得る必要が発生する。そこまでデータ分析者がやる必要があるかどうか、は別の問題だが。僕はやった方が長期的に見て効率が良いし、使われ続けるものが生まれると思っている。

それくらい、データ分析の過程においては、決めなきゃいけないことが多い。最初は非効率的だったとしても、コミュニケーションで生まれる「理解」が、後々効いてくると思っている。

そういう意味で、slackやZoomといったコミュニケーションを促進するツールの進化は本当にありがたい。この5年でグッと仕事しやすくなったし、今後の変化も楽しみにしている。

サポートされた者たちから受け継いだものはさらに『先』に進めなくてはならない!!