見出し画像

エムスリーに入社しました

本日7月1日にエムスリーにデータエンジニアとして入社しました。「入社っぽいモチーフと言えば桜だな」と思ったので、季節外れですがアイキャッチ画像に使いました。

なぜ入社(転職)ブログを書くのか?

なぜこのような文章を書くかというと、自分が入社する時に考えていたことを記録して、言語化しておきたいからです。

今回この記事を書く個人的な目的をまとめると、以下のとおりです。

・言語化しておくことで自分の考えを客観的に見ることができる
・言語化しておかないと当初やりたかったことや初心を忘れてしまう
・読んだ人が一人でも参考にしてくれたり、「いいね」してくれると嬉しい

入社・転職など人生の中でも大きな決断だと思います。しかし、入社してから仕事を一生懸命やればやるほど、数ヶ月・数年後に「なんでこの会社に入ったんだっけ?」とか「どういう仕事をやりたかったんだろう?」というように当初考えてたこと・やりたかったことを忘れがちです。もちろん、時間とともにやりたいことは徐々に変わりますが、やりたいことの方向性や嗜好は時間がたっても変わらないと考えています。ですので、今現在2019年7月1日何を考えていたかを記録し、3ヶ月後・半年後・1年後に読み返して振り返りや改善ができればと思います。

・・・

「お前誰やねん」と思うと思うので、まず軽く自己紹介します。

自己紹介

大学では日本文学や哲学を専攻していましたが、卒業してIT系の営業を1年くらいして自分に向いてないことに気づき、第二新卒で中小SIerの会社にエンジニアとして入社しました。未経験なのに採用してくれたのは有難かったです。

余談ですが、未経験でもやる気があれば採用してくれる日本企業および日本の採用システムは本当に素晴らしいと思います。

以下が簡単な経歴です。

・中小SIerでPHP、Java/Scalaで電力見える化系のシステムを複数開発
・「機械学習おもしろそう」+「海外でITのmaster取りたい」→ 2年間留学
(※このあたりの話は別途noteで記事として書くかもしれません)
・帰国後、データ分析やデータ基盤開発もろもろやる(Python/Go/GCP)

最近ではアウトプットを出していきたいなと思いいろいろやってます。

・技術ドキュメントの翻訳(TensorFlow等)
・ベイズに関連のブログ
・技術書の執筆
(すでに出版社と話が進んでいるテーマがありますが、進捗よくない)
・勉強会を開催(kaggleもくもく会やNLPの論文を読む会)

最近は趣味で勉強会をいろいろ開催したりしてます。kaggleもくもく会は現状隔月で開催してます(`・ω・´)


また、bq_sushi #10でNext 2019で発表されたBigQuery MLの新機能について登壇したり、Cloud Data Fusionのmedium記事を書いたり、GCP界隈でいろいろやったりしてます。

転職の理由

ここから本題です。

・・・

転職理由を整理すると、主に以下2点です。

・自分よりレベルの高いエンジニアと働きたい
・機械学習のシステムをすぐに開発・構築できる環境で働きたい

いわゆる鶏口牛後(鶏口となるも牛後となるなかれ)という言葉があります(※最近覚えました)。

つまり、「鶏の口になっても、牛のお尻にはなるな」ということで、意味としては「大きい組織(牛)の末端にいるより、小さい組織(鶏)のトップにいる方が良い」ということらしいです。

これを自分なりにエンジニアのキャリアに置き換えると

・鶏口: 小さい組織のトップとして無双する
・牛後: 大きい or レベルの高い組織の末端で修行する

となります。この言葉の意味としては「小さい組織のトップとして無双した方がよい」ということです。

しかし、エンジニアとして、牛(レベルの高い環境)のお尻(末端)でがんばってレベルアップした方がいいのではないかと思い始めました。スポーツの例で言えば、国内の2部組織のチームのレギュラー選手になるより、海外のトップチームの控え選手の方がいいんじゃないかなと。

また、先日は「データ分析・機械学習業界で生き残るということ」というタイトルのエモい記事を書いていて思ったんですが、やはり機械学習のシステムを今後作っていきたいと思った時に、前職だとデータ収集や整備であと2〜3年かかりそうだなと思ったのも大きな理由です。

データ基盤および収集の仕組み自体は構築したのですが、データがある程度の量集まるまで時間がかかりますし、その間に今最も面白い機械学習周りの技術やトレンドを指をくわえて見過ごすのは機会損失かなと思いました。

ともあれ、いろいろ自分の今後のキャリアをどうしていくか悩んだ上での転職です。

なぜエムスリーか?

以前からエムスリーは知っていましたが、機械学習というよりはScalaが強い会社というイメージでした。というのも、4年前にバックエンドエンジニアとしてScalaをやっている時、瀬良さんというScalaの伝道師みたいな人がエムスリーで働いていたからです(※現在はslackにいるみたいですね)。

そういうイメージだったんですが、ここ最近エムスリーは機械学習周りでブログや登壇、OSSとさまざまアウトプットを出しており、強いエンジニアがいるらしいというのがtwitterのタイムラインを見ての感想でした。

・・・

今回、エムスリーに決めた理由は以下のとおりです。

・機械学習を活用できる環境にある
・スピード感がある
・強いエンジニアがいる
・技術が好きな人が多い

長くなるとアレなので、最初の2つの理由だけ説明します。

エムスリーは今この時に機械学習を活用できる会社だということが一つ目の理由です。前述の転職理由の箇所でも少し書いたんですが、現状で機械学習を活用できる会社というのは正直少ないと思っています。

TJOさんのブログでも指摘されているとおり、ビジネスにデータを活用するには以下の7ステップがあるとされています。

1. データをビジネスの「エビデンス(根拠)」とし、「データドリブン」に変えていく
2. 次にデータを集めて「可視化」する
3. データを比較して「A/Bテスト」する
4. A/Bテストに「統計学的検定」で信憑性を与える
5. 「多変量モデル」を導入して同時に複数の要因にアプローチする
6. 「モデルによる予測(推測)」で未来のアクションや意思決定をサポートする
7. 「機械学習」とその「システム実装」による自動化を導入し、人手による「アドホック分析」とバランス良く使い分ける

(以下ブログ記事より引用)

それによると機械学習を実際にシステムとして導入するのは最後のステップで、ここに到達している会社 or 機械学習が本当に必要な会社は実質少ないと思います。ほとんどの企業は、まずは「データを収集する」・「データを整備する」・「データを可視化する」などが必要で、そもそもこれがちゃんと出来ている会社は肌感覚として少ないと感じています。

・・・

また、少人数のチームによりスピード感がある開発ができそう、というのが二つ目の理由です。エムスリーのAIチームでは、基本的に機械学習エンジニア + データエンジニアの2人のペアというチーム体制でシステムを企画・開発・構築するらしいので、不要なコミュニケーションが減ったり、意思決定を素早くすることができそうです。もし2倍のスピードで開発・構築・運用ができれば、ビジネス的にも価値がありますし、エンジニアとしても2倍の早さでレベルアップできるのではと思っています。

今後やっていきたいこと

エムスリーではデータエンジニアとして、データ基盤を構築したり、機械学習システム作っていきます。

個人のライフワークとしては、今後以下のようなことをやっていきたいです(日本語がアレですが雰囲気で感じ取ってください)。

・機械学習システムを爆速で開発し、イケてる運用ができるようになる
・GCP + 機械学習で最強になって来年のGoogle Cloud Nextで登壇したい
・NLP(特に翻訳)を勉強して、技術ドキュメントの翻訳作業を改善したい
・博士号取りたい

一言で言うと、GCP + ML + NLP でドーンです。

今後はプロのポエマーとしてもnoteでがんばって記事を書いていこうと思います。この記事を「スキ」およびシェアしてもらえるとやる気が出ます!(`・ω・´)

この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

89
機械学習システムアーキテクト
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。