見出し画像

文系未経験の営業が「ビジネス支援型データサイエンティスト」になるまで


2020/05/20:初版リリース
2020/07/28:第2版リリース


皆様、初めまして。ヤエリ(@yaesuri_man)です。


嬉しいことに、twitterでお会いした人から私の職業や経歴について聞かれることが増えてきました。

そこで自己紹介を兼ねて

・現在の仕事
・これまでの経歴

をまとめます。


データサイエンティストという職業にご興味をお持ちの方に

「えっ?そんな職種もあるの??」

というような、ある種の気づきになれば幸いです。


注意点:

初めにお断りしておきますが、私の経歴は正攻法ではないです。王道の学習順序と比べるとかなり遠回りだと思いますし、そっくりそのまま真似しても活躍できる保証はありません。加えて身バレ防止のために倍半分レベルで創作していますので、話半分で読んで頂けますと幸いです。

また学習に使用した書籍は文末にまとめてあります。


「ビジネス支援型データサイエンティスト」という職業


画像1


「ビジネス支援型データサイエンティスト」は、初代データサイエンティスト・オブ・ザ・イヤーであり現滋賀大学教授(元大阪ガス ビジネスアナリティクスセンター所長)の河本先生が創り出した言葉です。


「データサイエンティスト」と呼ばれる職業の中で、

 「機械学習を用いてビジネス課題を解決し、価値を生み出す」

のがミッション。

お客様のビジネス課題やAIに関するぼんやりとしたニーズをヒアリングし、課題を因数分解したり、課題自体を設定した上で

・ある時は人手による分析支援をご提供し
・またある時には分析ツールをご紹介し
・場合によってはお客様自身での解決方法を提示する

というように、課題の解決策を考えるのが私の役割です。


「データサイエンティスト(以下「DS」)」は「AI」や「ディープラーニング」と並ぶ流行り言葉であり、そのキャッチーな響きからも日々便利に消費されています(私も便利に活用してしまっています)。

ですが、この「DS」という言葉は本来多義的なもの。

ひとえにDSといっても、

 ①アルゴリズム自体を研究するDS
 ②データ収集・加工・整形など、データの準備を行うDS
 ③数理統計・pythonなどを駆使してデータモデルを構築するDS
 ④機械学習とビジネスを結びつけたり、ビジネス課題を解決するDS

これだけの区分け(※1)があり、現在の私の役割は④です。

要は「AIに特化したコンサル」みたいな感じですが、個人的に「コンサル」という言葉がちょっとしっくりこないので、河本先生の言葉をお借りしている次第です。

最近はDS以外にも、プリセールス、営業支援、マーケティング、広報などなど、かなり手広くやらせて頂いています。皆さん「営業出身のデータサイエンティスト」は珍しいらしく、今のところ似た経歴の方とはお会いしたことがありません。


私の強み


DSとしての私の強みはズバリ「人脈」です。

弊社は国内でも指折りのデータサイエンティストを擁しているうえに、個人的にこれまでの営業で培った社内外人脈も持っています。

新規のお客様から未知のAIテーマを投げかけられたとしても、それを相談する相手が大勢います。通常は深いドメイン知識がないと難しい「精度向上に寄与する特徴量探索」などについても、知り合いに相談し教えて頂くことで、「少なくともこの分野では〇〇のようですが・・・」と、仮説から入ることができるのです。この「仮説から入る」ことはDSとしてかなり大事でして、丸腰で「すみませんゼロから教えて下さい」とは信頼感醸成の上で雲泥の差があります。


もう一つは「物怖じしないマインド」ですね。

営業時代はエンタープライズのアカウントセールスとして、数十名以上の体制で毎年10億以上を売り上げていました。

複数の大規模プロジェクトを同時進行したり、顧客企業と自社の組織を抑えて上下左右隅々に根を張って面と面の関係を構築したり、ひいては〇〇億の損害が生じたトラブルに対応したりと、実に様々な経験を積ませて頂きました。

DSになってからはインパクト二桁億の案件はまだ経験したことが無いので、今はこれを目標に頑張っています。


私の弱み


私の弱みはpythonやSQLなどのプログラミングスキル。

趣味の世界でコードに向き合うことは好きですが、プログラミングそのものはお客様ベネフィットからはほど遠いように感じてしまい、もっと直接的に貢献したいなぁ、という思いがよぎってしまいます。

お客様からの依頼に基づいて過去のコード資産のコピペして対応することはあるものの、最近は若手にお願いすることの方が多いです。お客様との会話に困らない程度に最低限の処理は行いますが、それ以外のコーディングは積極的にはやらない、という感じです。

このあたりは学生時代にしっかり学んできたような方には全く敵わないですね。(そもそもそんな人種と勝負しようとは思いませんけれども。)


以上、ここまでが現在の私の自己紹介。ここからはこれまでの経歴をご紹介します。


学生~若手時代(20代)


画像5


これといった学歴ブランドを持ち合わせない文系(経済学部卒)です。

大学時代は簿記や計量モデルの勉強をしたような気がしますが、よく覚えておらず、現在のビジネスシーンでは全く活用できていません。

少しだけ役立っているかな?と思うのは、昔から「ログ取り」「ログ分析」が好きという性格。

当時パチンコ・パチスロにハマっていましたが、台の回転数や収益などを細かく記録し分析することが好きで、その結果を元に立ち回ることで、収益としては大きくプラスでした(全く自慢できる事ではないですけど。。。)


就活で、とあるIT企業から内定をもらい、社会人生活スタートとなります。


下積みの営業時代(~30歳)


画像2


新卒入社した企業は戦略的な営業方針を持たず、売れるものは何でも売る(※2)というスタンスでした。

・PCやサーバ、ストレージ、電話機やFAX、店舗のレジ
・webサイト構築からメール配信など
・データ分析や開発・運用受託
・ECサイト構築から物流配送業務受託までのフルフィルメント
・基幹系・実行系システムの構築

中でも私が興味を持って主体的に取り扱っていたのが、AIならぬBI(ビジネスインテリジェンス)。要は分析システムです。

通常、エンタープライズBIの検討主体はIT部門であることが殆どでしたが、私は敢えてそこには行かず、以下のようなBIを利用する現場部門に直接アプローチすることで、競合他社の営業との差別化を図っていました。

・経営企画部門
・マーケティング部門
・営業部門
・生産管理部門

一般的に上記のような現場はIT部門よりも力が強いもの。彼らから直接ニーズを拾い上げることで、お客様の言葉で語ることができ、響く提案ができるというわけです。

一旦エンタープライズBIを導入すると、その上場企業やホールディングス全体のお金の流れを把握でき、提供側としては中長期的なアカウントプランが立てやすくなります。要は受注が増えるわけです。

30歳前後で別のIT企業へ転職しましたが、新天地でもこの勝ちパターンで次々と大口取引顧客を育て、営業表彰の常連となりました。


機械学習案件を取り扱い始める(30代前半)


画像3


世界がリーマンショックから立ち直りつつあった頃、私は機械学習に巡り合います。

当時日本で機械学習はあまり注目されておらず、個人的には「本当にこんなの売れるのかな・・・」という感じでしたが、いわゆるタレントSE(※3)を客先に連れて行くと、機械学習を活用する分析案件をバンバン受注してくれるのです。

私は「彼のトークを身につけたら自分一人でも売れるんじゃない?」と考え、商談やコンサル時のやり取りを全てボイスレコーダーで録音し、全く同じ内容を完璧に再生できるようになるまで繰り返し聞き込んで記憶しました。つまり営業として分析案件を受注する目的で、数理・統計の内容を理解しないまま、表面上の言語の丸暗記を行ったわけです。

この行為の是非は置いておくとして、営業として分析案件を受注する上では効果てきめんでして、機械学習はBIと並ぶ私の主力商材の一つになりました。

更に当時、機械学習に着目してくれるお客様担当者は「お目が高い」実力者ばかりでしたので、そのまま彼らにアプローチすることで付帯案件を次々と受注することができました。「機械学習に興味を持っているかどうか」が、攻めるべき担当者なのかどうかを判断するための材料としても使えたわけです。(※4)


機械学習を学び始める(30代半ば)


画像5


機械学習を営業の武器としてすっかり会得した頃、「Harvard Business Review」という雑誌が「データサイエンティスト」という職業を「21世紀で最もセクシーな職業」などと特集し始めました。

当時は「大げさだなw」位にしか思わなかったのですが、その後将棋の電王戦が終了したあたりからいわゆる「第三次AIブーム」と呼ばれるようになり、私が取り扱っていた機械学習関連案件がにわかに注目され始めました。

同じ社内の中でも「なんだか凄いモノを売っている営業がいるらしい」というように、注目されるようになったのです。

更に、タレントSEが機械学習コンサルをしている様子を間近で見続ける中で、「意外と自分だけでも出来るのではないか?」という思いが芽生え始めました。

精度向上に必要となるドメイン知識の習得はエンタープライズBI提案時の営業スタイル「顧客業務理解」そのものですし、お客様とのやり取りの中で頻出する統計用語はある程度決まっていましたし(但しこれは大きな勘違いだった)。なによりお客様との密なコミュニケーションはアカウントセールスの得意分野。

というわけで、自分自身のキャリアの幅出しをする意味で、30代半ばで初めて、それまでうわべだけで語っていたデータサイエンスの中身の学習を始めました。

といってもやったことは結構シンプルで、pythonやSQLの基礎、kaggleを経験したあとは、ほぼ実戦。


なお、コンペでAUC=0.001の精度を争うことは、学問としては非常に楽しくタメになります。実ビジネスにおけるモデル構築でも、たまに仕事を忘れてkaggle脳に陥りそうになるくらい、精度向上は楽しいものです。

しかし実際のビジネスの場ではそこまでの精度を求められるシーンは稀。そのため私はkaggleのGetting Startedをやった後は、とにかく実戦で経験を積むことを意識しました。

具体的には、お客様とのやり取りの中で精度向上策を一緒に考えたり、ビジネス課題を機械学習問題に落とし込んだり、などなどです。

また架空のデータセットを元に、仮想ROIを算出するのが好きで、これはよくやっていました。


その訓練を、SIGNATEの練習問題(Airbnbの料金設定)を例に説明します。

例えばこの機械学習問題のROIを考えると、

・Airbnbでは、年間〇%分の不必要な値引きが生じていると仮置き
・予測精度向上で〇%の改善が見込めると仮置き
・宿泊費用の〇%がAirbnbの収益と設定
 →自分の予測モデルによる精度〇%向上で〇〇万円のビジネス効果

というような感じで、前提を置いた上で方程式を作る練習です。

これをやると、機械学習の精度向上を実ビジネスの利益に結び付けられるので、結構楽しいのですよね。

当時は遊び半分でやっていましたが、「今自分が書いているpythonコードは一体いくらの価値を生んでいるのか?」を常に意識する癖がつきましたので、何だかんだで今の仕事には一番役立っているかもしれません。とにかくお金に結びつけて考えるイヤな性格は元営業ならではですね(笑)


こうして「ビジネス支援型データサイエンティスト」になった私ですが、今思い返してみると、意外とエンタープライズ営業とデータサイエンティストは必要とされるスキルセットが似ています。

私の場合は、たまたま

・長らくBIや分析案件に携わっていた
・身近に機械学習に詳しいエキスパートがいた

という恵まれた環境で、後付けでデータサイエンスの勉強を始めた形ですが、今後は営業(またはLoB職)とデータサイエンティストの兼務職、みたいなのも出てくるのではないでしょうか。


まとめ


画像6


まとめです。

既にお気づきの方が多いと思いますが、要は早い段階で機械学習に目をつけ、一般の方より長期間関わっているという先行者利益を享受しているに過ぎません。

今から未経験でデータサイエンスに参入しろと言われたら、私の能力では恐らく無理。もっと美味しい、他のジャンルを模索していると思います。


実は我々データサイエンティストを取り巻く環境は、ここ1~2年でガラリと変わってきています。

「データサイエンティスト」「AI」「ディープラーニング」のような言葉が有名になったお陰で、単純なpythonコーダーは増え(※5)、企業としては彼らを安く調達できる土壌が整いつつあります。加えて、ここ最近のツールの進化は目覚ましいものがあり、「pythonでモデル組めます」「pythonで前処理できます」だけの人はどんどん淘汰されてしまうでしょう。(※6)

更には「内閣府AI戦略」のもとに、デジタル時代の読み書きそろばんである「数理・データサイエンス・AI」教育を受けた人材が市場に放出され、彼らとも勝負しなければいけません。文中でも触れましたが、大学院でしっかり学んできたDSは本当に優秀。業務終了後の勉強が趣味のような方々ですから、我々常人に勝ち目はありません。

とどめは昨今のコロナの影響。機械学習でビジネス価値を生み出せていないPoC止まりの企業は一斉にAI投資を絞るでしょうし、そうなるとDSの仕事が減るばかりか、投資を絞った事業会社から優秀なDSが市場に放出されます。転職市場での競争率は更に上がるわけです。


上記から、3年後・5年後にはDSが飽和し切るか、DS自体が不要となる時代が来るかもしれません。そうなった時もうまく生き残れるように、自分をどう変えていくか、何を学んでいくか、時代にどう適応していくかについては、常にアンテナを高くし、先行者利益を享受できるようにしておきたいですね。


以上、最後までお読みいただきましてありがとうございました。

今データサイエンスに興味を持って下さっている方の参考になれば幸いです。

ご質問などありましたらご遠慮なくお声がけください。


おまけ:学習に使用した書籍のご紹介


最後に、私が学習した書籍を幾つかご紹介します。

当時は発刊されていませんでしたが、後々読んでみて「これは是非おすすめしたい!」と思ったものも含みます。


【全体概要を知るための書籍】※必読

ご存知松尾先生(@ymatsuo)のベストセラー書籍。「人工知能」について誰にでも理解できるように平易な表現で説明してくれている良書中の良書です。データサイエンティストを目指す人だけでなく、「広く『人工知能』を理解したい」という全ての人におすすめ。


こちらはzozoの野口さん(@noguryu)の書籍。私が常々考えていた事が全て言語化されており大変な感銘を受けました。青山に押しかけてランチをご一緒した時に貰ったサインは私の宝物。twitterのヘッダー画像に使わせて頂いています。


【データサイエンスのビジネスへの活かし方を知るための書籍】※必読


河本先生の著書は、私の中ではバイブルに近い位置づけ。ビジネスデータサイエンスを語る上ではpythonやSQLの勉強よりまずはこちらをご一読頂きたいくらいです。


ビジネスの場で分析に携わる著名人の生の声が詰まっているムック。データサイエンスは綺麗事ばかりではない事を理解できる良書です。


「学問としての機械学習」的な書籍が多い(と私は感じる)オライリーシリーズの中で、実ビジネスに特化した珍しい良書です。実データへの機械学習適用方法や、機械学習を適用しないで済む方法、更には大企業にありがちな縦割り組織の中で他部門のデータを入手する際の注意点などなど、実務に特化した内容が満載。必ず読んでおきましょう。


上記の書籍を読んだ上で分析業務に携わり始めた人におすすめなのがこの書籍。和訳がこなれていない部分もありますが、データサイエンスの仕事の全体感を掴むのにおすすめです。


【G検定】

基礎を身につける意味ではG検定もおすすめです。


実は受かるためのテクニックがあったりします。


【統計や数学】

「データサイエンティスト=python」なイメージがあるようで、ほとんどのデータサイエンス講座がpython講座だったりしますけれど、私はpythonの前に(もしくはpythonと並行して)高校・大学の数学をやり直すことをおすすめしています。

特に文系卒の多くの方は大学1~2年レベルの数学をやっていないはずので、まずはこちらを身につけましょう。

私がお世話になったのは、このチャート式シリーズ。


高校の数学すら怪しいという人のためのリンクも貼っておきます(高1→高3の順)。


「たかが高校数学のおさらいに、いきなり3冊も買うのは嫌だ!」というワガママな人向けにはこちら「もう一度高校数学」。

※但し、自分に合っているかどうか、書店で実物を見てから購入しましょう。ものぐさな文系未経験者を食い物にするような書籍が多いためです。


高校・大学の数学を簡単におさらいした後は実戦に入りました。具体的には、Excelアドイン「分析ツール」を導入し、お客様のデータを解析する→分からない単語をwebで調べる・・・というような感じです。

実は古典的統計解析はバカにできなくて(誰もバカにはしていないと思いますが)、このExcelアドインがあれば現場部門からの多くの依頼に対応できてしまったりします。

機械学習とうまく使い分けていきましょう。


【python】

pythonはkaggleと実戦で覚えました。

後から思い返すと、当時以下の書籍やnoteがリリースされていたら、もっと効率よく学習できたと思います。


まずは「機械学習のための『前処理』入門」。これさえあればテーブルデータも画像も時系列も、とりあえずアルゴリズムに突っ込める状態にだけはすることができます(※7)。


私は未読ですが、カレーちゃん(@currypurin)と石原さん(@upura0)の共著「kaggleスタートブック」も評判が良いのでご紹介します 。


界隈で話題のkaggle関連本です。一見kaggleのスコア向上に特化したテクニック本のようにも見えますが、実はビジネスで機械学習を行う際に直面する精度向上への解決方法がふんだんに紹介されています。また過去のコンペの振り返りなどは読み物としても大変興味深いです。


【SQL】

SQLは「知恵の輪」みたいなもので、答えを見れば誰でも簡単に解くことかできてしまいます。そのため書籍を見る際は、まずは自分一人で考え抜いて、自分なりの答えを出した後に参照するのがコツです。

おすすめは、ミックさん(@copinemickmack)の「ゼロからはじめるデータベース操作」。


こちらもおすすめ。「書き込み式SQLドリル」。



注釈


※1:世間一般のDSのイメージは③であるものの、現在ビジネスの世界では仕事の出来るDSが②③④全てを薄く広く担当しています。この状況はシステム開発手法が確立されていなかったIT黎明期と同じ。当時は仕事のできるITの専門家が、要件定義から仕様への落とし込み、エンジニアリング、H/Wの構築、運用保守まで全てを担っており、その後PM、SE、PG、H/Wエンジニア、CEなど職種が細分化されました。DSに話を戻すと、既に②については「データアーキテクト」と呼ばれ始めていますし、今後は徐々に新たなDS職種が生まれることでしょう。


※2:当時IT営業だった私が販売したものの中で特に変わったものは以下です(上司から呆れられました)

雨傘除水器:雨の日に玄関で傘をバサバサ振って、水気を吸収させる機材です。あまり知られていませんが、これ1台で5万円くらいします。使い捨てのビニ傘カバーが不要になるということで、期末に売上が無い時はよくこれを売っていました。500店舗の小売企業に導入したらそれだけで2,500万円ですからね。構築作業も不要ですし、下手なサーバ製品よりよっぽど手離れが良いです。

フォークリフト:物流倉庫などでパレットを移動する時に使うフォークリフト車です。ECサイト構築業務の流れで物流倉庫にも手を出した際に確か500万くらいで売りました。実はこの手の重機は保守費用が美味しいのですが、フォークリフトのベンダのポリシで、保守契約の商流に入ることはできませんでした(車体のみ販売し、保守契約はベンダ直となった)。


※3:タレントSEは数理のPhD。知識もさることながら顧客のペインポイントをロジカルに捉え、それを機械学習問題に落とし込むのが非常に巧いタイプでした。今でも私の周りにはこのタイプのDSが数多く存在しており、大変刺激を受けております。


※4:当時の私の中で機械学習と並んでホットだったのが「RPA」。むしろ機械学習より凄いぞと大感銘を受け嬉々としてローリングをしましたが、残念ながらこちらは全くの鳴かず飛ばずでした。この領域は現場の担当者の汗水で何とか対応してしまっていた部分なので、経営層の投資に対する意識がまだ低かったことが原因。最近で言うと、機械学習の前処理作業と同じような位置づけだったのかもしれません(前処理にお金をかける経営層がほとんどいないので、当時を思い出しました)。あれから数年、今こうして機械学習とRPAの両方が「AIブーム」の波に乗りクローズアップされている事は、なんだか面白いなぁと感じます。当時一緒にドサ周りをしたRPAベンダの営業さんは今や役員クラス。転職の誘いに乗っておけばよかったかなと少しだけ後悔(笑)


※5:どうも世間では「データサイエンティスト=pythonのプログラマ」のようなイメージがあるようです。言うまでもありませんがpythonはツールに過ぎず、それをどう活用するかのほうが重要。目的と手段の逆転現象にはくれぐれもご注意下さい。更にはそういう方々を食い物にする「未経験からDSを目指すpython講座」みたな質の悪い講座が乱立していますのでこちらも要注意です。「響く!ウェビナー実践講座」みたいなコンテンツをよくよく見たら単なるzoomの使い方講座だった、というのと同じです。


※6:「pythonでモデル組めます」はAutoML、「pythonで前処理できます」はデータプレパレーションツールに置き換わると思います。スタートアップ企業を中心にしのぎを削っていますので、詳細はガートナーのマジッククアドラントなどを参照すると良いでしょう。


※7:初心者にとっての大きな壁の一つが「前処理に問題があり、アルゴリズムがデータを受け付けてくれない」です。この書籍を参照すれば、まずはテーブルデータ、画像、時系列データについて、アルゴリズムに合う前処理について学べます。

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
note.user.nickname || note.user.urlname

この記事を読んで、支援したいなと思って下さった方へ。金銭的な支援よりも、いいねやスキボタンを押して頂いたり、SNSでシェアして頂いた方が筆者は喜びます。是非お願い致します。

好きなアルゴリズムは何ですか?私はLightGBMです(ヤエリ)
43
機械学習の力を経営の力に。元営業の「ビジネス支援型データサイエンティスト」
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。