データサイエンティストは今からすぐになれる。
はじめに
近年ますます、データサイエンティストの需要と熱が増しています。というのも、これまで蓄積したデータを上手に活用できていない企業や研究室が多いからです。効率的な開発の推進を期待されて、データサイエンティストが注目されています。
では、どういった場面でデータを活用するのでしょうか。例えば、下記のようことが挙げられます。
①既存製品の性能を上げるために、どう改善すればいいのか。
②今よりも製品を安くするには、どう改善すればよいのか
③顧客ニーズの傾向
④活躍する社員の傾向
⑤投資すべき事業
⑥製品の販売価格
⑦市場の変化予測
など、気になるものはすべて数値化して、データとして扱い、それを解析することで、次に取り組むべきことが明確になるのです。
データ分析の現状
私の勤めていた企業では、データをうまく活用できているとは言えない状況でした。例えば、開発品自体は量産していたのですが、開発の軸が、単なる自分の仮説に過ぎず、根拠となるデータや、その仮説の実証が明確にされないままでした。このような状況ですので、開発の方向性は見えず、果たして良い製品に仕上がるのであろうかと不安を覚えるばかりでした。実際に、製品化するまでに時間やコストがかかり、効率は悪かったです。データを活用できていた点としては、製品の獲得量の改善です。製品作製中の温度変化や作製するための装置の稼働状況は数値化されて記録されていました。この数値をもとに、獲得量が少ない時を分析することで、要因を突き止め、改善することで、獲得量をアップすることに成功していました。工場生産レベルの製品ですと、獲得量を数%改善しただけで多大な利益となります。以上のことから、あらゆることに対してデータを武器に改善を図ることが有効といえます。
基本的に数値化する癖をつけておけば、分析して、改善を図ることが出来るという点を覚えておきましょう。ある企業では、就活試験時に受けるSPIの点と、入社後の社員の活躍度合いに相関があるのかを分析していると聞いたことがあります。実際に、相関があり、SPIができた人の方が、入社後に活躍する傾向にあるために、SPI試験を継続しているとのことでした。このように、入社後の活躍というy軸に対して、SPIの試験結果をx軸において、傾向を見ているわけですが、y軸とx軸にそれぞれ何を置くかが基本的な考えとなります。
真面目に勉強してきた方は要因として何をおくべきなのか、答えは何なのかと考えがちになってしまいます。しかし、問題集とは違って、確実な答えはありません。あなたが、これまでの経験や、一通り調査して、これが最も影響しそうだ、なぜならこういう理由だからだ。という考えをもって、分析していけばよいのです。答えが無いものに対して、あなたが思う答えを根拠と共に見つけていくのです。最初からうまくいくとは、限りません。第二の要因、第三の要因も用意して分析しましょう。
次に大切なのは、要因をどう数値化するか、どうやってデータを収集するかを考えることです。これを評価系を作るといいます。評価系を作れる人は重宝されます。この時も、自分なりの評価系を作って、試し、改善していけば良いです。数値化は困難に感じられるかもしれませんが、自分で基準や定義を作って、それをもとに数値化すれば、大抵のことは数字として表すことができます。そして、エクセルで、散布図のグラフを作成し、xーyの相関関係を見ていけばデータ分析となり、自分が次にどうすれば良いかの方向性となります。
データサイエンティスト思考
機械学習やパイソンなどを使うよりも大事なことは、仮説実証型の思考であるかどうかです。これに基づいて、行動が行われていなければ、暗闇かつ出口のないトンネルを永遠と歩くことになります。
①課題の発見 世の中(顧客、自分は)は何を欲しているのか
キーエンスの考え方に真のニーズと言われるものがあります。顧客自身も気づいていない最も欲しているものが何なのかを突き止めることが、競合に打ち勝つことにつながります。抽象化するなどして、視野を広げて考えることで、真のニーズに気づくことができるかもしれません。
②課題を解決するための方法や物は何なのか
ここで、製品開発を行っていくことになります。課題をどのように解決するのか、コンセプト、いわゆる仮説(y軸)を考えだします。例えば、お湯を沸かしたいというニーズに対して、どのようにしてお湯を温めるかを考えます。火や電気を利用して加温するのか、電磁波を照射して水を振動させて熱を発生させるのかなど、最も、真のニーズに近いものを考えだします。
③評価法の考案と改善のサイクルを回す
次にx軸となる要因を考えていきます。マイクロウェーブによる加熱方式を採用するのであれば、W数を変数としておく事を思いつきそうです。そして、W数ごとに昇温速度などを測定していけば、効率的にお湯を沸かす方向性が見えてきます。性能を上げていくという点では、一つの要因の傾向がつかめたら、第二の要因の傾向を分析して、改良を量ります。例えば、水をいれる容器の性質が要因になりそうだと考えた場合に、容器の種類を変えていきます。そして、その容器を数値化していく訳ですが、熱伝導率であったり、マイクロウェーブ照射による温度上昇量など、自分で定義して分析していきます。そして、良化傾向を確認して、良化の方向に改良していきます。このようにして、性能を改善していきます。エクセルを利用してグラフを作成し、可視化して、傾向を確認しましょう。
④コストや時間との兼ね合いを見て性能の妥当性を見る
一般的に、高性能品は高コストかつ開発時間を要します。性能が求められているものよりも高すぎると、上記問題が生じ、採用されずに終わってしまう場合があります。ですので、コストや開発時間とのバランスを意識して、性能改良を行っていくべきです。
以上の点を意識して、あらゆる活動に取り組めば、改善していくことが可能です。
この記事が気に入ったらサポートをしてみませんか?