見出し画像

未来を見据え、データの海へ飛び込む──先見の明を持つ若きデータサイエンティストの成長に迫る

大手生命保険会社を退職し、データサイエンティストを志しテクノプロ・デザイン社に転職を果たした京谷 尚紀さん。入社前の面接から現在まで、抱いていた想いを実現できていると話す彼にテクノプロ・デザイン社の魅力を語ってもらいました。


時代の潮流に乗り遅れることなく、ビジネスシーンで活用していく能力を養いたかった

学生時代は主に数学を中心に学んでいたのですが、就職活動を始めるにあたって、自分の一個人としての能力を人の役に立てられるような場で働きたいと考えました。

そこで出会った生命保険業界は、資産運用などのお金に関わる投資機関でもあり、また、各商品の設計やリスク評価などのための保険数理といった計算手法の分野を含めて、学生時代に学んできた知識を活かすことができると考えました。

配属先には保険数理の入社コースもあったのですが、まずは会社全体の動きや営業の方がどのような働き方をされているのかを知るべきだろうと考え総合職からスタートし、実務的な仕事をこなしていました。その後にジョブローテーションのタイミングが訪れたものの、他部署への異動ではなく技術に特化した職種を志し転職することにしました。

と言いますのも、総合職として仕事をこなす中でもさまざまなデータに触れる場面があるのですが、これらのデータをこれまでに学んだ数学の知識を活かし、現状把握や分析をして企業戦略に役立てられるだろうと漠然と考えていたからです。全社的にはおそらく戦略を立てているのだろうと思いますが、当時は入社して年数も浅くなかなかそういった作業に時間を割くことができませんでした。

そんな想いを抱えていた中で訪れたジョブローテーションの機会。その中で、データの活用方法は保険業界だけではなくさまざまな業界でも活用できるだろうといった考えや、最新のAI活用事情や大規模データの解析技術を正しく理解することで時代の潮流に乗り遅れることなく、適切にビジネスシーンへ活用していく能力を養いたいといった自分自身の技術力向上の気持ちも高まり、データサイエンティストとしての道に進もうと転職を決意しました。

決意をしてからというもの、技術に対しての自己学習を精力的に実施していました。学生時代は紙と黒板とチョークを用いて数学を学んでいたのでデータを扱うような場面はほとんどありませんでした。ただ、統計学の授業や、C++やR言語を使ったプログラミングの授業がありましたから、それら当時の授業を思い出しながら復習しつつ、その学んだ基礎部分を応用し、データ分析でもよく扱われるPython言語の自主学習を進めていました。

また、AIや機械学習に関する書籍を読んで知識を蓄えつつイメージをつかむようにしていましたね。

ただ、学習を進めていても企業が求める実務に必要な技術力を養えているかはとにかく不安でした。ですが、テクノプロ・デザイン社の面接時に、「2カ月の技術研修を受講した後は、OJT形式で教わりながらデータサイエンスの実務経験が積める」という説明を受け、その不安は払拭されましたし、安心して経験を積んでいける環境に惹かれました。

また、テクノプロ・デザイン社は、幅広い業種のお客様がいらっしゃり、そのお客様毎に業務課題があり、求められる技術者も異なります。だからこそ、多様なデータや分析課題に触れることや、さまざまなバックグラウンドの技術者との情報交換を通じて自分自身の視野を広げることもできるのではないかと感じられたこともあり、テクノプロ・デザイン社への転職を決めました。

学習については継続的に実施しています。業務において必要だからおこなう学習もありますが、統計に関しては単純に数学が好きなので趣味の範疇としても学習や書籍を読んでいます。古本屋に行ったときにぱらぱらと書籍を見て、興味が湧いたものをまとめて購入し、時間をかけながら消化しています。

広い視点で物事を捉え、分析業務を実施することが何より重要

テクノプロ・デザイン社に入社してから2年経過しましたが、経験を重ねるごとにいろいろと成長の実感を得られるようになりました。

これまでに業務で携わってきた分析手法は、教師あり学習による分類モデルの特徴量(分析対象データの中の予測の手掛かりとなる変数)分析や、回帰分析による予測モデルの検証、自然言語データ集計による傾向分析、業務改善系とさまざまですが、共通してお客様が抱える課題に対する示唆を出していくことが主なミッションと言えます。

分析で扱う技術としては、汎用性や有識者の多さからチームで作業するのに適しているPython言語、SQLを主に扱っています。また、PythonライブラリではpandasやNumPy、scikit-learn、Matplotlibを利用することが多いです。これらの技術は自主学習や研修、OJTを通じて身につけたものでもあり、実務上で思う存分活用ができていますね。

その他、自主学習ではR言語を活用することもあります。R言語は統計処理特化のプログラミング言語であり、Pythonとはまた違った良さを感じる部分もありますから自身の技術力向上の一つの糧としています。

このように技術に対する知見を蓄積することで技術力向上につながっていると感じますし、データ処理の自由度も高まってきていることの実感を得られています。

また、課題を意識してデータへ向き合えるようになったとも感じています。

お客様から依頼される課題は、時にはスケールが大きく抽象度が高めであることもありますが、その課題の本質を捉えられるかによってデータの扱い方やアウトプットの方法が変わります。そういった広い視点で物事を捉え、分析業務を実施することが何より重要だと感じるようになりましたし、そこを意識した活動をするように心がけています。

データサイエンティストに囲まれ、多くの影響と学びが得られています

プロジェクト内ではマネジメント担当と分析業務を実施するメンバーとが存在し、役割分担をしつつチームとして機能できるように情報共有をしながら活動しているのですが、私は実務面を担当し、いろいろなパターンの分析をしています。

ただ、分析業務だけではなく、マネジメント担当に対してデータの見やすさを考慮した上での集計や分析の方法を提案することはよくあります。実際に分析する立場だからこそのモノの見方があるわけで、協力し合いながらプロジェクトを遂行しています。

データ分析で優先していることは、大前提としてデータを誠実にありのままの実態を捉えたアウトプットを創出することと、データからどういった考察ができるかといった示唆に関わる部分です。分析して結果の報告をおこなうだけですと数字の情報がそこにあるだけなので、この結果をどのように考察をして読み解くか、お客様に最もわかりやすく伝えられるような工夫をして資料に落とし込むことが必要です。

中には、抽象度が高い依頼もあるかと思いますが、こういった場合には依頼内容から推察できる課題を具体的に洗い出し、お客様やチーム内でのコミュニケーションを重ね、擦り合わせをし、実作業に移ることが求められるかなと思います。

また、お客様からの依頼である以上、納期が存在するわけですから、この部分への配慮も欠かせない大事なポイントです。このポイントに対しては分析の段取りや作業内容、ボリュームに対して必要な工数を概算で見積もりながらスケジュールを作成して実施していきます。そうすると機械学習モデルの学習速度や分析処理、データ抽出の速度にも注意が必要です。

対象となるデータが大きければ大きいほど処理に時間がかかりますので、所要時間をマネジメント担当の方と一緒に擦り合わせてスケジュールを引いていきます。また、抽出されたデータはすぐに分析できる状態であるとは限りませんから、分析がおこなえる状況までの準備前処理にかかる時間がおよそどのぐらい必要かも注意しています。目的を果たすためにはどのような分析が必要で、その分析に必要な要素や作業、それらにかかる時間を概算で予測しながら進めていく必要がありますので、全体的に俯瞰して推し量る能力も蓄積されていると実感があります。

これらは技術の向上と共にビジネスマンとしてのマインドや意識向上につながり、お客様にとっての戦力として成長できているのかなと思いますね。

そして、この成長は周囲の人による環境も大きく作用しているように思います。直近ではお客様との契約が変わり、同時に環境も大きく変わりつつありますが、これまで携わっていたプロジェクトではお客様側や別の企業から合流されてきたデータサイエンティストの方々が多くおられましたから、その方々とのコミュニケーションやプロジェクトを共に手がけることでノウハウの吸収や自身の学習意欲への促進剤にもなります。中には、元々ソフトウェアの開発をされていた方もいらっしゃり、開発をするときの目線や他の分野だからこその視点での気づきや学びも得られています。特に、最近影響を受けたのはこの開発者の目線ですね。

データ分析をする目的は数多くあるわけですが、ビジネス的な課題解決のためデータを分析をして状況把握することを目的としたものだとか、これまで人に依存してきた仕事をAIに任せて自動化させるといったさまざまな目的がある中で、後者の機械化を促進させる開発技術にはあまり目を向けてこなかったんですよね。

テクノプロ・デザイン社に入社し出会った技術者には機械学習系のプログラミングに特化した方もいらっしゃいますが、やはり異なる知見を持つ方の影響は刺激にもなりますし、この領域の知識や経験も養いたいなと思うようにもなりました。

私の思うテクノプロ・デザイン社の一番の魅力とは

技術の世界は奥深く、幅も広いです。そして日々進化する業界でもあるので、身につけるべき技術や知識は際限がありません。だからこそ、他の技術者の方との交流を図ることで自分の見識がさらに彩られ、世界も広がっていく。これを実現できる環境にはあらためて魅力を感じます。

今後の目標は、業務や個人の活動を通じてデータサイエンティストとしてさらなる成長をしていきたいと考えています。業務においては、課題が漠然としている状態でも、本質的な課題や問題点を見出し、データから根拠立ててお客様の課題解決に貢献できるといった仕事の質を高められたらと思います。

そして、以前に社内の有志メンバーとして参加させてもらったSIGNATEの航空経路データを用いたウェイポイントの推定コンペだとか、Kaggleのコンペを覗いて参考になりそうな情報を収集し、成長の糧になるような活動にも、できる限り積極的に継続して参加していきたいと考えております。

最後に、この記事を読んでいただく方の参考となれば嬉しいですが、データサイエンティストやデータエンジニアは、分析手法や仕事の進め方などで広い知識が求められます。だからこそ、この領域の学習を、業務上必要で仕方ないといったケースもあると思いますが、義務感に捉われてしまうと大変なように思います。

ただ、データから法則や傾向を解き明かすおもしろさが溢れていますし、自分自身の能力にも比例していくわけですから、そこにやりがいを見出せる方は向いているかなと思います。

※こちらの記事は2023年6月時点の情報となります。


▼テクノプロ・デザイン社の採用情報はこちらから

▼テクノプロ・デザイン社のメルマガ登録はこちらから

メルマガ登録(社会人向け)

メルマガ登録(学生・第二新卒・既卒(3年以内)向け)