見出し画像

メンバーズ講演会 代表の感想と講演会の内容


概要

2022年5月23日(月)16:20より、株式会社メンバーズ メンバーズデータアドベンチャーカンパニーの現役データサイエンティスト吉川寛様を講師に招き「データサイエンティストという職業」と題してオンライン講演会を開催しました。

本企画は立命館大学のサークルである経済学AI研究会 マシンエコノミクスが提案し、関麻衣准教授に講演者の紹介を受けて実現しました。データのビジネス活用やデータサイエンティストという職業に関心のある参加者が集まり、会場は熱気を帯びていました。

学生に加えて、立命館大学キャリアセンターの職員の方や立命館大学経済学部執行部教学担当の橋本貴彦教授も参加されるなど、データサイエンティストという職業への注目度の高さが伺えます。

代表の感想

今回の講演会は非常に情報量が多く、大変参考になるものでした。
マシンエコノミクスは昨年度できたばかりのサークルであり、身近にデータサイエンティストがいなかったために学習方針を決めかねていたのですが、今回の講演会で得た情報をもとにより実用的で高度な知識・技術を身に着けられるように学習内容をアップデートしていきたいです。
 
特に私は、データサイエンティストは分析の専門家であり、ただ与えられたデータを分析する人だと思っていたため、データサイエンティストがデータを「ビジネスに活用する方法」を柔軟に考え出すことが求められるクリエイティブで複合的な仕事であることを知ることができてよかったです。
 
また手法・技術ありきではなく、直前する問題やビジネスをベースにして問題解決の「手段」である分析手法を選定していかなければならないという話を聞き、少し自分の学習スタイルを省みました。
なぜなら、現在私はまさにゼミで機械学習を応用した論文を作っている最中なのですが、ちょうどこれが手法・技術ありきの学習、研究になっている節があると感じるからです。
しかし、学習の初期段階のまだ右も左もわからない状態では、まずはひたすら手法やツールを頭に詰め込まなければ何もできるようにならないというものまた事実であり悩みどころです。
そういう意味では吉川様の手法・ライブラリ・メソッドを丸暗記するのではなく脳内にインデックスを作るべしというアドバイスは大変参考になるものでした。
 
また吉川様はライブラリやメソッドの公式ドキュメントを必要の都度自分で読み解けるというスキルが必要不可欠で、多くの公式ドキュメントは英語で書かれているために英語力も重要だと仰っていましたが、これは私も最近意識するようになった課題であります。
 
というのも、マシンエコノミクスの活動目的は率先して機械学習を用いた経済学の現状を調べ、実践すること通してそのギャップを吸収するクッションのような役割を果たし、団体外にビジョンを示すことを通して、機械学習を応用した経済学の学習・実践を行うオープンなネットワークとその拠点を形成することであります。
その為には当然機械学習を経済学へ応用した事例を調べなければならないのですが、機械学習の経済学への応用はほとんど本になっておらず、さらに日本語に訳されているものは皆無と言ってもいいくらいです。そのため学習を進める上で英語の元論文を読むことが重要だということを最近痛感しています。
機械学習について書かれた文章は日本語のものを読んでもチンプンカンプンなので英語論文となるともっと大変そうです。
今回の講演会で得たアドバイスを活かして今後もいっそう学習に励もうと思います。
 

メンバーズ紹介


メンバーズグループは「日本中のクリエイターの力で、気候変動、人口減少を中心とした社会課題解決へ貢献し、持続可能社会への変革をリードする」をビジョンとしており、デジタルマーケティング支援をはじめ本業を通して社会課題解決を行う企業です。


今回の講演者である吉川寛様が勤める株式会社メンバーズ メンバーズデータアドベンチャーカンパニー(以下DA)はこのメンバーズグループの「カンパニー」の一つであり、「データ領域特化プロフェッショナル常駐サービス」を提供している会社です。


具体的にはデータサイエンスを現実世界に応用するための基盤であるデータエンジニアリング(分析のためにデータを収集して解釈し、検証すること)の支援を行うことが多いそうですが、他にも「ネットワーク分析を用いたオンデマンドバスの運行最適化におけるKPI研究」、「統計的因果推論を用いた巨大プラットフォームでのマーケティングキャンペーン効果の検証とマーケティング戦略の見直し」等のデータサイエンスを活かしたビジネスの支援を行っているそうです。

私個人としては以前からネットワーク分析に興味を持っていたので、ネットワーク分析の応用方法を考えていたのですが、バスの運行最適化にも応用できるとは驚きです。


講演者紹介


今回の講演者である吉川寛様は私達と同じ経済学部出身であり、現在はデータサイエンティスト・ビジネスプロデューサーとしてDAでクリエイティブコーチを務めています。

学生時代、当時は9.11の直後だったこともあり、世界のことを知るには宗教を知らなければならないと考え、宗教を学習していたそうです。

また労働経済学のゼミに属し、宗教・政治・歴史・文化による人の意思決定の差異に興味を持ったことから北欧の就労文化についての卒論研究に励んでいたそうです。

意外なことに当時は統計学が大嫌いだったそうで、その頃は二度とやりたくないと思ったとのことです。

ちなみに好きな経済学用語は合成の誤謬だそうです。

*合成の誤謬:一人ひとりが正しいとされる行動をとったとしても、全員が同じ行動を実行したことで想定と逆に思わぬ悪い結果を招いてしまう事例。


吉川様は最初からデータサイエンティストとして働いていていたわけではないそうです。新卒時は小売業を営む会社に就職し、自分で作った売上実績の評価法が正式採用されるなどの活躍をしていたそうです。当時はまだデータサイエンス等の専門性の方向についてはあまり意識していなかったとのことです。

その後コンサルティング会社のスタートアップ事業に転職し、そこでweb解析とコンテンツ制作のマネージャーを務めたことでweb分析の楽しさに気づいたそうです。

さらに事業会社に転職し、データ収集・加工・分析ロジック設計等のデータ分析サービスの責任者を務める中でデータに関連した仕事の楽しさを確信、またこの時にとある凄腕データサイエンティストに出会い、一緒に仕事をする中で本格的にデータサイエンティストという仕事を意識するようになったそうです。ちなみにちょうどこの時期に世の中ではデータサイエンスという言葉が出回り始めたようです。

そして現在はデータサイエンティスト兼プロジェクトマネージャーとしてデータサイエンティストが活躍できる環境を作る仕事をされています。



データサイエンティストとは



“I keep saying the sexy job in the next ten years will be statisticans. And I'm not kidding.”

Hal Ronald Varian


データサイエンティストという言葉は近年生まれたそうで、以前まではstatistican(統計家)と呼ばれていたそうです。

近年のデータ活用を取り巻く流れは以下のように発展してきました。


1990年代、計算機の急激な性能向上によりデータからパターンを見つけ出して活用する取り組みであるデータマイニングの研究が大幅に加速しました。

2000年代には個人レベルでインターネットが普及してデータの量が増大しました。そして2010年代、大量のデータをビジネスに活用する取り組みが行われるようになり、ここでデータサイエンティストという職業が必要とされるようになってきたとのことです。


データサイエンティストはデータ分析ができたり統計に詳しかったりするだけではダメで、それを「ビジネスに活用する」ことが求められるクリエイティブで複合的な仕事であるそうです。


データサイエンティストには「ビジネス力」「データサイエンス力」「データエンジニア力」が求められます。データサイエンス力とデータエンジニア力はどんなデータサイエンティストでもある程度共通した知識や技能が求められますが、ビジネス力に関しては多種多様なようでここが持ち味を生かす差別化ポイントだそうです。

経済学をバックグラウンドに持つ人がデータサイエンティストを目指す際はここが比較優位になるかもしれませんね。

データサイエンティストの活躍分野はマーケティング(レコメンドエンジン)・製造流通(輸送最適化)・医療(画像認識)等、多岐にわたります。

これら全てが出来なければデータサイエンティストを名乗れないのかと聞かれればそうでないそうで、これを一人で全て網羅するのは不可能であり、またそうする必要もないそうです。


吉川様は興味のある特定の分野・領域に着目するのがおすすめだといいます。

興味のある分野・領域を探す際は自分が何をしているときにテンションが上がるのか、時間を忘れるのかを意識するとよいとのアドバイスもいただきました。

ちなみに吉川様は人がものを買うのを見ることが好きであり何時間も見ていられるほどだそうです。これに加えてwebマーケティングの経験もあったことあらマーケティング領域に着目したそうです。


反対に技術・手法に着目するのはおすすめできないとのことです。一つの技術・手法に依存しているといくら熟練度が高くてもそれが法律で禁止された際・需要がなくなった際に困ってしまうことに加え、データ分析の手法はあくまでも問題解決の手段の一つであり、手段と目的を逆転させないことが重要であるそうです。


直面する問題によって適用する手法やモデルを選定し、その都度柔軟に新しい手法を身につけてゆく等、あくまで問題・ビジネスベースで考えなければならないとのことでした。


大学生に最も伝えたいこと


最後に吉川様が最も伝えたいと仰っていたことを紹介します。


「データは社会に出た後でも学べますがサイエンス、つまり科学的思考は時間をかけないと身につきません。そして大学の教員はその科学的思考のエキスパートであるため大学は科学的思考を身に着けるうえで最高の環境です。」だからこそ「大学ではデータ以上にサイエンスを学んでください。」とのことです。


圧倒的に足りていないスキルはデータではなくてサイエンスであり、吉川様は科学的思考の中でも特に「措定による命題の定義」、「正しい推論」が大切と仰っていました。

「措定」とは「あるものの存在あるいは命題の真理性を、それとしてとりあげて肯定的に判断すること。証明されるべき最初の命題。」であり、前提なく何かを正しいとすることはできないためこれは論理的に議論を展開する際の前提となるものだそうです。

(例:Qデータサイエンティストはモテますか?

Aモテないと思います!モテるを「不特定多数の異性・同性から好意を持たれること」と定義した場合、データサイエンティストという職種的な魅力の問題の前に職種そのものが知られていないです。この場合モテるの要件のうち「不特定多数」をみたしません。よってモテないと思います。)


また「正しい推論」とは既知の事実をもとに推論によって論理の飛躍がないように議論を展開することだそうです。

この2つのスキルが欠けているがために統計・エンジニアリングの知識が豊富であってもデータの活用に失敗してしまうケースも多いそうです。

そしてこの2つのスキルが最も養われるのが大学での論文の作成であることと科学的思考のエキスパートが大学の先生であることから、大学は科学的思考を学ぶ最高の環境であると吉川様はおっしゃられました。


データサイエンティストもサイエンティストであり、取り組む問題の解決にはこれらの科学的思考が必要不可欠とのことです。



Q&A集


Q データサイエンティストが働いている会社は具体的にはどんなところでしょうか?

A 様々な業界でデータ活用が進んでいるので、多くの企業に所属しています。大手メーカーには研究チームがあったりします。日立はデータサイエンスラボを作っていましたし、ダイキンはAI人材の採用・育成に力を入れているようです。データ量という観点からWeb系の企業は多く所属しています。Google、ZOZO、楽天、リクルートなどのような大手企業はもちろんスタートアップのWebプロダクト開発会社にもいます。私の所属するメンバーズやブレインパッド、アクセンチュア、サイバーエージェントなどのような支援会社にも多くいます。


Q プログラマとデータサイエンティストの違いは何でしょうか?

A プログラマはプログラミングをする人ですね。プログラミングとは「コンピュータに処理させる命令を記述すること」です。機械言語はどのように動くのか、またどのようにすれば最適な動作をしてくれるのかを考えてコンピュータに処理させる命令を書きます。

一方でデータサイエンティストは統一的な定義はありませんが、多くの場合「統計・情報科学を活用して問題を解決する方法を生み出す人」ですね。プログラミングを利用することがほぼ必須ですが、最終的にどのような価値を生み出すのかが全く違います。


Q データサイエンティストは最近流行りですが、飽和しないでしょうか?

A 流行り出したのは2010年以降で、12年がたった今でも求人は増えています。提示されている年収がどんどん下がっているわけではないので現時点では飽和しているわけではなさそうです。今後は飽和ではなく細分化していくかなと考えています。私が一番増えると考えているのはデータサイエンスの知見がありビジネス上の企画・マネジメントができるデータサイエンティストです。これは解決すべき問題に対してそれを実行できる専門家を選択し一緒に解決への議論を深めていくような存在です。この役割が少ないがために多くの企業でデータ活用が失敗しているように感じます。

 

Q 学生時代にどんなことをしておられましたか(経済学とデータサイエンスの関わりも含め)

A 大学時代は統計学大っ嫌いでした。卒論に必要なので勉強しましたが正直その頃は二度とやりたくないと思っていました。数学は得意だったんですけどね。主に学習していたのは宗教と労働経済学です。2001年の9.11 直後だったので世界のことを知るには宗教を知らなければならないと考えて学んでいました。労働経済学はゼミで学んでいました。北欧の就労文化が卒論テーマでした。宗教・政治・歴史・文化による人の意思決定の差異を知りたくて取り組みました。それ以外はバンド活動をしていました。ファンクとかジャズとかそっち系です。ドラムをやっていました。


Q データサイエンティストを志した理由は何ですか?

A データを見てその裏で何が起きているかを想像するのが好きだからですね。小さい頃からデータを見るのが好きでした。日経平均は毎日変わるから楽しいという理由で小学生の頃からずっと見ていました。自由研究ではクラスメイトが夏休みの宿題をいつ頃終わらせ たかアンケートをとってまとめたりしていました。人生で初めて実施した時系列分析です。 こういうことが背景で、データを専門にできる仕事があると知ったのでやってみようと思いました。


Q データサイエンティストという職業の魅力とは?

A なんでもできるとこかなと思います。まだ固定した職種イメージがあるわけではないので、データを使ったビジネス貢献を自分なりに組み上げて行くことができます。問題解決能力が試されますがものすごく伸びると思います。


Q データサイエンティストの1 日は?

A 1日と言われると難しいですね。私の場合、ルーティン業務はあまりなく、分析要件設計・利用する分析手法の詳細調査・分析・レポート作成・取り組むべき課題を見つけるための社内&社外調査をスケジュール立てて回している感じです。


Q 経験した中で一番大きな案件やビッグなデータにはどんなものがありましたか

A データの大きさで言えば、1日10億件程度の検索データと広告効果検証の分析業務がありました。案件で言えば、現在も続いていますが巨大プラットフォーム運営事業者でのデータチーム構築・データ基盤構築を推進するリーダーをしています。

 

 

Q 今まで関わってこられたお仕事の中で印象的だったもの(内容、クライアントとの関わり)はありますか

A  昨年末の大規模なキャンペーン効果検証はとても面白かったです。全体の分析設計を行い、その設計に見合うようにデータを取得できるように計画していきます。実験計画と呼ばれるものです。具体的には市場調査アンケート設計・キャンペーンログデータの設計・定点観測とキャンペーンの微調整による使用変更などなど。
キャンペーン終了後に効果検証を行い、次年度のマーケティング戦略を大きく変える発見があり採用されました。データの収集設計から関わることはあまりないので貴重な経験でした。

 

 

Q データサイエンティストを志す人が取るべき資格などはありますか

A 資格が必ずしも必要ではないですが、資格をベンチマークに学習することは良いと思います。あえて資格でいえば、統計検定2級レベルはどんな形でデータサイエンティストになるにしても必須だと思います。2級で初めて推測統計学の基礎が出てきますが、これが理解できていないと各手法を学んでも「何をしようとしているのか?」とういうことが理解できず、数式を読み解くモチベーションが維持できないです。



Q 情報科学、情報理工学出身でなくともよいデータサイエンティストになれるでしょうか?

A 「機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック」の著者、森下 光之助氏のように経済学をバックグラウンドにもつデータサイエンティストも多数活躍しておりますので確実になれます。


Q プログラミング・数学・経済学・経営の知識がデータサイエンティストに必要だと理解していますが、それぞれどれくらいの水準が求められるのでしょうか?

A

▼プログラミング 使用する言語の基本的な文法、ライブラリのドキュメントを読んで利用することができること。

▼数学 大学初等レベルの解析学系分野(微積分・線形代数) 。

▼経済学 経済学部卒DSの強みなので沢山勉強してほしいです。ゆえに最低限はないです。

▼経営 これは曖昧ですが向き合っているビジネスのビジネスモデル (収益構造や生産構造、商流)を把握する必要があります。しかしこれはDSに限定されることではないと思います。

Q ライブラリやメソッドが多すぎて覚えられません。そもそもプロのデータサイエンティストは何も見ずにやっているのでしょうか?

A よく使うものは覚えていますが、ほとんど覚えてないです。重要なのは「これやるときにこんな感じのやつ使えたよな」って頭の中にインデックスを作っておくことです。そうすればググれば出てきます。エンジニアの多くはそうやって業務をしているようですね。エン ジニアリングやプログラミング専業でないデータサイエンティストならよりそのスキルが必要です。だからライブラリやメソッドのドキュメントを読めるスキルの方が重要です。 ただ、覚えようと思わなくても言語なので使っているうちに結構覚えるようになりますのでご安心ください。

 

Q データ分析した結果何もわかりませんでした、となったらデータサイエンティストはどうするのでしょうか ?

A「何もわかりませんでした、なぜならこういった理由からです。この分析の方向性はあたりが良くないので、次はこういうアプローチを取ってみます。」というような報告をします。データ分析の結果何もわからないことはあります。ただしこれは多くの場合、措定の甘さや仮説設計の問題、取得しているデータの問題に帰着するのでそこを見直します。

 

 

Q ディープラーニングが流行りですが、それ以外の機械学習(k近傍、決定木など)は役に立ちますか?廃れていきませんか?

A 役立ちます。ノーフリーランチという言葉があるように、あらゆる問題を効率よく解けるような“万能ツール”はありません。むしろ統計的因果推論的な立場で考えれば、前提となる状況によって適応できるモデルが異なるように、ある手法がある手法より絶対的に素晴らしいということはないと思います

 

Q 就職活動をしていく中で、データサイエンスを活用できる方法がないか聞いてみたいです。他の人とは違う視点で企業を見ることができればいいかなと思ったからです 。

A 四季報とかに企業データが掲載されているので、それを収集して分類器にかけてみるとか面白そうですね!

 


Q 公認会計士や税理士ってAIに仕事を取られてしまいますか ?

A 公認会計士や税理士はAIを使う側になると思います。法改正や経済主体(個人や法人)の事情の変化には専門家が向き合う必要があります。それ以降の事務的な手続きはどんどん自動化されると思います。ただし、作業的な業務だけをしているのであれば仕事はなく なっていくかもしれません。


 

Q データサイエンティストはモテますか?

A モテないと思います!モテるを「不特定多数の異性・同性から好意を持たれること」と定義した場合、データサイエンティストという職種的な魅力の問題の前に職種そのものが知られていないです。この場合モテるの要件のうち「不特定多数」をみたしません。よってモテないと思います。



Q スタートアップの会社にとって必要なのはどのようなデータ分析ですか

A スタートアップで一番重要なのはデータ分析できる状況を作ることです。新しいサービスは良し悪しを定量的に判断できるようなデータがないので、取れるデータをとるのではなく、何を狙うのか・何を評価したいのかを事前に考えた上でデータを収集できるようにしてゆくことがスタートアップでは大事です。



Q  経営コンサルタントを目指しているのですが、戦略系の理論・産業組織論とデータ分析ではどちらを学習した方がいいでしょうか


A 私ならばデータ分析でない方を選びます。

経営コンサルタントもデータ分析を利用しますが、経営コンサルタントはデータ分析をするというよりもデータ分析を依頼する事の方が多いので、自分でデータ分析ができることよりも発注できることの方が大切です。これについてはその都度学べますが、体系的な理論は大学でないと勉強しづらいです。


Q データサイエンスをやるうえでプログラミング言語はどれをやればいいでしょうか

A プログラミング言語は会社ごとに違うのでケースバイケースで、入った会社で採用されている言語を覚えなければいけません。ただ今はPythonのライブラリが使えることがほぼ必須になってきています。


 

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?