見出し画像

機械学習でハタラクをバクラクにするために LayerX に入社しました #LayerX

こんにちは、2022年9月1日に LayerX にフルタイムの機械学習エンジニアとして入社した松村 優也(@yu__ya4)と申します。バクラク事業部の AI-OCRチームに所属しています。チーム名の通り、請求書や領収書といった帳票の画像データを読み取り、人間が手入力せずとも必要な項目を自動で抽出してデータ化する OCR 機能の開発をメインのミッションに持つチームです。

この note では、私がなぜ LayerX に機械学習エンジニアとして入社したのかを、転職のご報告に代えてお伝えしますめちゃくちゃ仲間を探していますので、少しでも気になった方は Meety や Twitter のDM からご連絡ください!

略歴 - LayerXに入社するまで

まず簡単に、LayerX に入社するまでの私について紹介します。より詳しい経歴やこれまでのアウトプットは以下の Wantedly のプロフィールをご覧ください。

学生時代は京都大学大学院にて情報検索・情報推薦の研究を行なっていました。2018年に新卒でウォンテッドリー株式会社に入社し、新設された推薦システム開発チームに1人目のデータサイエンティストとして参画し、最初の1年はプレイヤー、その後はリーダーとしてチームの立ち上げや成長を推進してきました。同時に、プロダクトマネージャーとして Wantedly Visit 全体の成長に責任を持ったり、エンジニアリングマネージャーとして開発組織全体の成長に責任を持ったりと、ベンチャーらしく何でも屋さんとして走り続けてきました。ウォンテッドリーをフルタイムとしては退職しましたが、推薦システムや機械学習領域の技術顧問として引き続き事業成長をサポートさせていただいていおります。

その他の活動として、大学で非常勤講師として推薦システムの講義を行なったり、推薦システムの書籍を共著で執筆して今年の5月に出版したりしています。他にも、推薦システムについて技術イベントや学会で登壇したり、ブログを書いたり、勉強会を開催したりといった活動も積極的に行なってきました。また、9月末に開催される推薦システムのトップカンファレンスである RecSys には今年もこっそりとオンライン参加する予定です(時差つらい)。

そんなこんなで「推薦システム」という技術領域を背景として活動することの多かった松村なので「なぜOCR チーム?」と気になっている方もいるはず!ですので今回の note ではその経緯を簡単に説明します。そして、そこには LayerX で機械学習エンジニアとして働く魅力が詰まっているはずですので、少しでも多くの方にお伝えすることができますと幸いです。

契機 - LayerX との出会い

そもそも LayerX とはどのように出会ったのか。LayerX という会社が存在するということは元々知っていましたが、「Gunosyさんの元経営陣の人たち作った会社らしい」「ブロックチェーン事業を立ち上げた先進的な会社らしい」「と思ったらブロックチェーン事業からピボットしたらしい?(読んでないがブログがバズっていたことは知っている)」程度の認識でした。

そんな中、ある日 Twitter で LayerX 代表取締役CEO の福島良典さん(通称fukkyyさん)の以下のツイートが流れてきて、なんとなく読んでみた note に感銘を受けたことが今でも記憶に新しいです。

こちらの内容は私が LayerX に入社した理由の大きな部分でもあり、後ほどの入社理由の説明でも触れるのですが、当時次のキャリアについて漠然と考えていた私の頭の中の「機械学習を強みとしてプロダクトを作っていくならこうあるべき」という姿をほぼそのまま言語化したようなものでした。

以下は感動のあまり言語化の責務を捨て去った私のツイートです。

そして、この残念なツイートの1時間後に代表取締役CTO の松本勇気さん(通称ワイマツさん)からDMをいただいたのがすべての始まりでした。このレイヤーの人がこのスピード感でDMを送ってくださるという事実に驚いたのと、何より note を読んだ感動を伝えたくてお話させていただくことにしました。

松村のツイートから65分後のDM

初回の松本さんとの面談は声をかけていただいた文面の通り本当に技術的な雑談で終わり、採用活動のそれを一切感じさせませんでした。その誠実さにも心打たれ、その場で改めて会社についてお話を伺うためにカジュアル面談を申し込ませていただきました。

話が外れてしまうので今回は詳しく書きませんが、LayerX の採用フローは一貫してホスピタリティが高く本当に良い体験でした。

所以 - LayerX になぜ機械学習エンジニアとして入社したのか

それではいよいよ本題です。なぜ LayerX に入社したのかを説明するのですが、細かいことも含めるとたくさんあって書ききれません(し、あえて私が書く必要性も薄いでしょう)。そこで、「機械学習エンジニアとして」入社した理由にフォーカスを当て、最も大きい3つの理由に絞ってお伝えすることにします。

Ⅰ. 機械学習をコアに据えたプロダクト

「機械学習をコアに据えたプロダクト開発に関わりたい」というのが、私が次のキャリアを考えるにあたって辿り着いた一つの答えでした。先に断っておきますが、これは手段を目的化してしまうという、機械学習プロジェクトの現場ではあるあるな(?)アンチパターンの話とは異なります。「手段を目的化してはいけない」「機械学習はあくまで手段であり、課題解決に必要でなければ使うべきでない」というのは、前職でプロダクトマネージャーを担っていた私が口を酸っぱくして毎日のように唱えていた呪文でもあります。

機械学習を使うことを目的とした(あるいは気づいたらそうなってしまっていた)プロジェクトの多くは、技術的には難しいことをおこなっているが本質であるユーザーの課題解決が十分にできていないものとなってしまったり、解決すべき課題に対して過剰なコストをかける結果となってしまいます。その結果、利益を生まないため事業判断で継続的な開発を行うことができず、かつ機械学習を利用したシステムはメンテナンスにも大きなコストがかかるため、負の遺産となってしまいます。使い方がまずかっただけなのに「機械学習はまだ我々には早い、実務には使えない」などといった、悲しい結末を迎えてしまうのです。

機械学習が好きなひとりのエンジニアとして、そのような悲しい結末を迎える方が1人でも少なくなるといいなと思っていますので、おすすめの書籍をぶら下げておきます。

では「機械学習をコアに据えたプロダクト」とは何かというと、一言で表すならば「機械学習がプロダクトの価値を提供するための nice to have ではなく must have となっているプロダクト」とでも言えるでしょう。私はこの度の転職活動において何度もこのフレーズを使いました。もっと砕けた直感的な言い方をするならば、「機械学習を利用するからこそ十分な価値を提供できるプロダクト」「機械学習モデルの精度を1%改善すれば、プロダクトのNSM/KPI が◯%向上し、利益が□%増えるようなプロダクト」といったところでしょうか。機械学習という技術が直接的にプロダクトの価値や事業成長に繋がっている、つまり、機械学習という技術が経営と紐づいている、だからこそ機械学習に投資する判断ができる組織で働きたい、あるいはそのような組織を作りたい、というのが今回の私の転職活動における一番の軸でした。

今回の転職活動で様々な会社のお話を伺いましたが、明確に機械学習という技術が経営と紐づいている、機械学習をコアに据えたプロダクトを開発している/しようとしている組織はまだまだ少ないように感じました(※だから良くない、という話では決してありません。私が次のキャリアとして選択したいと考えた軸とは異なる、と私が感じたというだけです)。その中で、この軸にマッチすると私が感じた会社のうちの一つが LayerX でした。そしてそれを感じた最初のきっかけであり、その内容が分かりやすく言語化されているのが先ほど紹介したCEO福島さんの note でした。

なぜ LayerX がこのタイミングで機械学習をプロダクトのコアに据えることにしたのか、その詳細はこちらの note に譲り割愛しますが、その判断に至った3つの要素を引用しておきます。

MLをコアにしてしっかり継続投資が回る条件としてLayerXが考える要素は以下の3つです。

① MLに投資することで、サービスのUXが改善されて、収益改善につながるビジネス構造を作れていること
② アノテーション済みのデータが溜まっている+今後たまり続ける構造があること
③ (短期的に)ROIのよい、ヒューリスティック・ルールベースでの精度改善による運用が限界を迎えていること

『LayerX、ML(機械学習)を本気でやりますという話』より引用

これらは、機械学習がプロダクトのコアとなるに足る必要条件として私が考えていたものに一致しており、この note を読んだり実際に中の人の話を聞いていく中で、LayerX が確かにこれらの条件を満たしているということを確信することができました。(本当はこれらのそれぞれについても伝えたいことがあるのですが、それはまた別の機会に…)

機械学習プロジェクトがこれらの条件を満たす必要があるということは、機械学習やデータ分析を生業としている方々からしたら当たり前のことのように感じるかもしれません。しかし、その当たり前を実際に高いレベルでこなしてきており、適切なタイミングで意思決定をしており、それを言語化してアウトプットにまで至っている組織はなかなかないのではないでしょうか。

これが、私が機械学習エンジニアとして LayerX に入社した第一の理由であり、最大の理由です。

Ⅱ. 今後の機械学習活用への無限の可能性

次の理由として、LayerX の掲げる今後の事業展開の構想の中に無限の機械学習活用の可能性を感じられた(かつ、その構想がチャレンジングだが不可能ではないと感じられた)ことが挙げられます。

私は現在 AI-OCR チームに所属しており、請求書を始めとした帳票の読み取り精度の改善をメインのミッションとして持っています。もちろんこのミッションの達成は大変重要なものであり、精度が少しでも改善されればそれだけユーザー体験は良くなり事業貢献へと繋がります。

一方で、これだけでは限界があるというのも事実です。大前提、機械学習モデルの予測精度は100%にはならないため、OCR機能の機械学習モデルの精度改善はこの先ずっと取り組み続ける余地があり、その価値もあるでしょう。しかし、100%ではないにしろ一定以上の読み取り精度を達成した時点でユーザーへの提供価値の大きさの改善幅は緩やかになることでしょう。もちろん、そこにコストをかけることが事業的に合理的ならば改善を進めるべきですが、この1点だけで機械学習をコアに据えたプロダクトとして継続的に事業を展開することには限界があります。

また、技術者という観点からすると、(十分難しく面白い問題ではあるのですが個人の意見としては)帳票の読み取りOCR機能だけにこの短い貴重な人生をかけるというのは正直面白味に欠けてしまうかもしれません。面白味というのは、事業的観点から見るとどこまで重きを置くべきかは考えものですが、あくまで個人のキャリアとしては重視して然るべきだと思いますし、ということは、継続的な事業の継続という意味では満たすべきものでもあると私は考えます。

この点で言うと、LayerX は請求書や領収書の読み取りをしたいだけの企業ではありません(繰り返しになりますが、これも十分に面白いし難しい!)。LayerX は、「すべての経済活動をデジタル化する。」ことをミッションに掲げた企業です。ソフトウェアテクノロジーをもとに、新たな「経済基盤」を作り出します。もっと具体的に言うと、世の中の「お金の移転」が関わるマーケットをまるっと対象にした事業を展開します。この非効率でアナログな業務プロセスを続けてきた領域を、テクノロジーの力で改善するのです。

LayerX のミッション

以下は、バクラク事業において提供する具体的なサービスと、対象とするBtoB取引マーケットに存在する機能(≒課題)を表した図です。この市場のセンターピンである「請求書受取」からサービスの展開を始め、「稟議」や「電子証憑保存」、「経費精算」、「法人カード」と歩みを進めてきています。

ちなみに、私が最初に説明を受けた際の資料では「経費精算」も「法人カード」もまだリリースされていませんでした。特に、バクラク事業が次のステージに進むための目玉だと聞いていた、素人目で見ても技術的、事業的に大変難しいポイントが多いであろう法人カードがリリースされていたことには改めてそのスピード感に驚きました。

バクラク事業の提供サービス郡

ご覧の通り、ミッション実現のために対象とすべき市場、解決すべき課題はまだまだたくさん残っています。BtoB取引マーケットとは説明するまでもなく大変大きく多様な市場なので、大量で複雑なデータが存在します。つまり、現在力を入れている請求書や領収書のOCR機能以外にも機械学習がその力を発揮できるであろう潜在的な価値がたくさん眠っているのです。

たとえば、現在提供している請求書受取のサービスだけを見ても、請求書読取OCR機能だけではなく、読み取った項目に応じて勘定科目や税区分などを自動で入力する仕訳補完機能などが考えられます。一見、ルールベースで解決できるように思うかもしれませんが、実は自然言語的には同じ品名でも会社によっては異なる勘定科目に設定していたり、そもそも品名にばらつきがあったり不十分であったりと、ナイーブに解くには難しい問題であったりします。

また、法人カードについて考えると、利用者の与信を推定するというタスクがすぐに思い付きます。つい最近 Kaggle においても、 American Express の過去の取引データをもとに、顧客が貸し倒れになるかどうかを予測するという Competitions が開催されましたので記憶に新しい方は多いのではないでしょうか。カード事業を展開するにあたって与信推定というのは、健全に事業を進めていくために大変重要な課題です。

さらに、それぞれのサービスを連携した価値というのも考えることができます。たとえば、法人カードで決済を行なった取引履歴と、OCRでデータ化した領収書データを自動で紐づけることができたならば、あの面倒な経費精算という作業を一瞬で終えられる世界が来るはずです。このデータの紐付けについても、データの量や質を鑑みると一筋縄ではいかないと考えており、機械学習が活躍するのではないかと睨んでいます。

そして、これは今時点では夢のような話になってしまうかもしれないのですが、バクラクが目指す世界線であらゆるB2B取引のデータを集められた暁には、それらを活用した「便利」を超えた価値を提供できると考えています。

企業間のありとあらゆるお金のやりとりの情報が集まれば、状況ごとの妥当な費用というのが分かるようになるかもしれません。たとえば、従業員数が100人程度でSaaS事業を展開しているIT企業のクラウド利用費用はいくらくらいだとか。たとえば、このシーズンにロンドンに出張するならば、この経路でこの便に乗ると妥当な金額でかつ便利であるとか。

これが実現できると、上記の例でしたら企業規模や事業内容に応じた適切なクラウド費用予算の設定や、出張のための航空便レコメンドといった機能を提供することができるかもしれません。つまり、ただ便利なだけではなく、企業の支出の最適化も行えるのです。もちろん、それらの支出管理はバクラク経費申請やバクラクカードなどで一気通貫して管理されているのです。

ここまで挙げた例の他にも様々なデータ活用、機械学習技術の活用によって価値を提供できるケースが存在するでしょう。これが私が機械学習技術の無限の可能性と表現しているものであり、LayerX に入社を決めた第二の理由となります。

このあたりの話は以下の Podcast でCEO福島さんが説明しているので是非聴いてみてください!

そして、勘がいい方ならもうお気づきかもしれませんが、「推薦システム」 という技術領域をバックグラウンドとして色濃く持つ私がワクワクしている理由もここあります。単純に先ほど、航空便レコメンドというキーワードが出たというのもありますが、もっと本質的な部分における共通点があると考えています。

推薦システムとは私の書籍でも紹介しているのですが、「複数の候補から価値のあるものを選び出し、意思決定を支援するシステム」のことを指します。この観点で考えると、企業のお金のやりとりに関して様々な選択肢がある中で様々な意思決定を支援していけるであろうこのサービスは、本質的には推薦システムと同じ枠組みで価値を提供するものであると私は考えました。そして、私が推薦システムに対して魅力に感じているのは、この情報洪水の時代に意思決定の支援によってユーザーがより良い体験を得られるという点なのです。

従って、私は今回の転職によって推薦システムというバックグラウンドを捨てたとは一切思っていません。直接的に使う技術やぱっと見の構造は異なるかもしれませんが、本質的に提供する価値や考え方には大きく共通する部分が存在すると考えています。ですので私はこれまで培ってきた技術や経験をもとに、新しい領域で新しい形の推薦システムにチャレンジしているのです。

また、LayerX には私が所属する SaaS のバクラク事業部だけではなく、MDM事業とプライバシーテック事業部があります。これらも事業も機械学習技術の親和性が高く(そもそもプライバシーテック事業は機械学習の技術が前提としてある)、バクラク事業部との事業やデータの掛け合わせを考えるとさらに可能性は広がるでしょう。

LayerX の展開する3つの事業

Ⅲ. 経営層の機械学習への理解の深さ

最後の理由として、経営層が機械学習に対して技術的観点と事業的観点の両軸で深い理解を持って経営を行なっているという点が挙げられます。経営層の理解がない場合、機械学習を活用するプロジェクトは様々な壁にぶつかることになるからです。

たとえば、機械学習プロジェクトを進めるにあたっては、データ収集のためのロギングの仕組みの実装やデータをうまく活用するためのデータ基盤の作成、ABテスト基盤の作成など、取り組みそのものがすぐに直接的にサービスを改善するには至らないが必要であるものが多々あります。またこれらは機械学習チームだけではなく、アプリケーション開発チームやインフラチームと協働してチーム横断的に動く必要のあることが多いです。

経営層は、このような短期的に成果が出るわけでない取り組みに対して少なくないコストを払う意思決定や、チームを横断してプロジェクトを進めるための権限を機械学習チームに与える必要があります。この際に機械学習への理解が浅いと、あるいは機械学習チームを信じていないと、必要以上にそれぞれの取り組みの必要性の説明を求め、(往々にして難しい)将来的な事業貢献の見積りをチームへと求めてしまい、本来進めたい機械学習モデルの開発に集中できないという状況に陥ってしまいます。

また、機械学習プロジェクトというのは不確実性が高く、いくらオフラインのデータでモデルの予測精度をシミュレーションしたとしても、実際にリリースしてユーザーに届けてみないことには正しい性能を評価することができません。そのため、時には大きなコストをかけて開発したモデルをリリースしてみたがサービスの改善が見られなかった、などということも起きます。

経営層は、このような機械学習プロジェクトの不確実性を理解した上で、成果に対する期待値調整や計画の策定を行う(機械学習チームのマネージャーと握る)必要があります。この際に機械学習への理解が浅いと、一度うまくいかなかった時点でプロジェクトをストップさせてしまったり、そもそも機械学習の利用を諦めてしまいかねません。

この点、CEO福島さんとCTO松本さんは、前職で機械学習を強みに持つプロダクトを開発するにあたり、機械学習技術を前提とした経営を行なってきた経験があります。そもそもお二人とも機械学習の研究や開発を実際に行なってきた経験を持っており、機械学習への理解という点ではこれ以上にない経営体制なのではないかと思います。

これまで紹介してきた「機械学習をコアに据えたプロダクト」「今後の機械学習活用への無限の可能性」も経営層の深い理解という礎があってのものでしょう。

選考の中で実際に経営層の機械学習への理解の深さを感じる場面もありました。たとえば選考の途中でCEO福島さんと面談する機会をいただいたのですが、めちゃくちゃ忙しいはずなのに30分の面談時間をオーバーして気づいたら1時間以上も機械学習活用の構想について熱く語ってくださったりしました。

また、実は1年ほど前に私が執筆した推薦システム/機械学習についての技術ブログを福島さんが読んでツイートしてくれていたということもあり、「きちんと技術のことを分かっている経営者の方なんだなぁ」という印象は元から抱いていたのですが、それが確信となりました。

CTO松本さんの技術への理解が深いことは言わずもがななのですが、実際に面談や会食でお話しした際の技術への深い理解や知識への幅、技術そのものへの好奇心は私が今まで関わってきた人類の中でも圧倒的なものを感じましたし、機械学習という技術によって今後実現されていくであろう世界への解像度の高さには脱帽でした。

これらの出来事からも、経営層が機械学習に対して深い理解を示しており、その結果としての今があり、それは点でなく線として未来に繋がっていくであろう、という判断をしました。これが私が機械学習エンジニアとして LayerX に入社することを決めた3つめの理由です。

結論 - LayerX で一緒にハタラキましょう

見出しの通りです。笑

以上、お伝えしてきた通り、私が機械学習エンジニアとして LayerX に入社したのは「機械学習をコアに据えたプロダクト」「今後の機械学習活用への無限の可能性」「経営層の機械学習への理解の深さ」の3つを LayerX が持ち合わせていたからです。

しかし、これらが現状揃っているからといって、必ずしも順風満帆に成長していけるかというとそうではありません。これだけ明るい未来の可能性について語ってはいますが、まだまだたくさんの不確実性に溢れているというのが現実です。この先どこで大きな壁にぶつかってしまうかは予見できないですし、大きな失敗や後戻りも生じるかもしれません。しかし、その不確実性を減らすことはできます。それは、ミッションに共感して LayerX の掲げる未来に本気で懸けて一緒に走ってくれる仲間の存在です。

 今回紹介した通り、LayerX において機械学習エンジニアとして働くことには大きな魅力と可能性があると私は考えています。もちろん我々の他にも魅力的な会社はたくさんありますが、技術的にも事業的にもここまで面白いタイミングで参画できる機会はなかなかないのではないかと思います。

2022年9月現在、機械学習エンジニアは私を含めて4名となりました。私たちのミッションの達成のためにはさらなる機械学習技術の力が必要であり、人数としては数年以内に10倍の規模にしたいと考えています。機械学習チーム立ち上げの背景と最近の状況については、マネージャーの高際さんの以下の note をご覧ください。

まだまだ力が足りません。あなたの力を貸してください。私と一緒に、すべての経済活動をデジタル化し、ハタラクをバクラクにし、シゴトでココロオドルひとを増やしましょう!

少しでも興味がある、面白い、松村と雑談してみたい、と思ってくださった方は以下のLayerX Open Door や Twitter の DM からご連絡ください!しばらくの間はできるだけすべての方とお話しする時間を取りたいと考えています。


この記事が気に入ったらサポートをしてみませんか?