見出し画像

書評 「仕事ではじめる機械学習」!

どーも、消費財メーカーでデータサイエンティストをやっているウマたん(https://twitter.com/statistics1012)です。

個人活動として、スタビジというサイトYoutubeチャンネルでデータサイエンスやビジネスについての発信をしています。

大学で機械学習やデータ分析を学んで、いざ社会人になって実践!となっても実際上手くいかないことは多いです。

そう大学で学ぶデータ分析とビジネスで必要なデータ分析は大きく違うことが多いんです。

そんな時にオススメなのが「仕事ではじめる機械学習」!

この本は、ビジネス観点から機械学習について教えてくれる良書です。

個人的には、機械学習の書籍なのに、機械学習を使わないで解決できる方法を考えよう!と書いてある点が非常に好感を持てます。

そう、機械学習はあくまで手段であり目的ではないんです。

機械学習を導入することが目的になってしまうプロジェクトは失敗しやすいです。

何のために機械学習を導入するのか・機械学習を導入しないで解決できる方法はないのか、について考えておきましょう!

この記事では、そんな「仕事ではじめる機械学習」について簡単に紹介していきます!

それではいってみましょう!

目次はこのようになっています。

1章 機械学習プロジェクトの始め方
2章 機械学習で何ができる?
3章 学習結果を評価しよう
4章 システムに機械学習を組み込む
5章 学習のためのリソースを収集しよう
6章 効果検証
7章 映画の推薦システムをつくる
8章 Kickstarterの分析、機械学習を使わないという選択肢
9章 Uplift modelingによるマーケティング資源の効率化

第1章から第6章までで機械学習をビジネスに活用する基礎知識について学び第7章以降で具体的な事例とともに手を動かしながら学ぶケーススタディ式の構成になっています。

それぞれの章について簡単に解説していきます!

Youtubdeでこの内容を動画にしています。

第1章

まず、第1章の機械学習プロジェクトの始め方では、機械学習をビジネスに活用するプロジェクトの全体感をつかみます。

この章だけでも非常に有用で、すでに機械学習を仕事で使っている方も初心に立ち返って読んでみてほしい内容になっています。

課題の洗い出しから、その課題を解決するために機械学習が本当に必要なのかを考え、その上でシステム設計やアルゴリズム選定、データの準備・加工、モデリング、システム導入をしていく流れがつかめます。

それぞれのフェーズでの注意点や、導入後の保守・運用に関しても学べます。

本を読んでいる時間がない!という人はぜひ1章だけでも読むと機械学習の使い方の全体感が学べますよ!

第2章・3章

2章では、細かい手法のアルゴリズムについて学び
3章ではモデルの評価について学びます。

ただ、この書籍で警鐘を鳴らしているのが、モデル性能のチューニングにどっぷりはまらないようにするということ。

モデルの性能が高いこととビジネスゴールを満たすことは別の問題なので、そのモデルで何が実現したかったのかを考えるクセを付けましょう!

どうしても機械学習というとモデル構築して精度を上げることに注目してしまいがちなのですが、それは目的ではなくあくまで手段の1つだということを念頭においておきましょう!

第4章

4章では機械学習をシステムに組み込む時に考えるべきことについて学びます。

機械学習モデルで算出したアウトプットはバッチ処理で日別で連携すればよいのか、それともリアルタイム連携するべきなのかなど実装面で考慮しなくてはいけない部分が多くあります。

これらの仕様は、現実的な運用と照らし合わせながら、ビジネスゴールを満たす観点で考えましょう!

第5章

5章ではデータ収集について学びます。

いくら手法が優秀でもデータが不十分ですと得られるアウトプットは使い物になりません。

このデータ収集の部分は泥臭いところではありますが、非常に重要です。

第6章

6章では効果検証について学びます。

実際に機械学習を導入する前手にABテストなどを行い、本当に効果が上がるのか、どのくらい効果が上がるのかを検証します。

効果検証の注意点についてビジネスにおける観点で学ぶことができます。

第7章

7章以降では実際にPythoのコードと共に実践的な内容を学んでいきます。

7章では映画のレコメンドロジックを協調フィルタリングという手法を用いて学んでいきます。

第8章

8章では、Kickstarterというクラウドファンディングのサービスの分析をおこなっていきます。

実際にデータを抽出して加工して可視化して分析していくわけですが、ここの章の面白いところは機械学習を一切使わない点。

実務の分析課題では機械学習を使う前提で動くプロジェクトはありませんし、あったとしても間違いなく失敗します。

この章のように最初は基本的な基礎分析を行い、その上で機械学習によるモデル構築が必要になれば機械学習を使うのです。

実務に即した非常に有益な内容になっています。

第9章

最後の9章ではアップリフトモデリングという手法について紹介されています。

アップリフトモデリングとは、4象限にユーザーを分けて介入効果の良し悪しを比較する手法です。

クーポンを配布しないと購入してくれないけど配布すると購入してくれる「説得可能層」をあぶり出します。

実務では複雑な状況で施策の介入効果を検証しなくてはいけません。

その時、知りたいのは、施策を打った場合に反応してくれるお客さん。それをピンポイントで見つけるのがアップリフトモデリングなのです。

ここまでで、ざっと「仕事ではじめる機械学習」について紹介してきました。

非常に分かりやすく実務に即した内容になっているおすすめの書籍!

ぜひ「仕事ではじめる機械学習」を読んで、仕事に機械学習を活かしていってくださいね!

以上、データサイエンティストのウマたん(https://twitter.com/statistics1012)でした!

スタビジというサイトYoutubeチャンネルでデータサイエンスについての発信をしていますので、こちらもよろしくお願いします!

それではまた今度!
Let's statistics×bussiness「スタビジ」!

この記事が気に入ったらサポートをしてみませんか?